參加Python課程,文科生可能比數理生來的得心應手(上)

 

參加Python課程,文科生可能比數理生來的得心應手(上)

參加Python課程,文科生可能比數理生更優秀,打破你的刻板印象(上)

文組不適合學 Python 與 Java?《Nature》:外語天才其實更適合寫程式

說到 PythonJava 等程式語言,很多人都認為理科生的專利,這樣的刻板印象,也讓許多有志當軟體工程師的文科生望之卻步、自我設限。其實根據美國《Nature》旗下自然科學期刊《Scientific Reports》發表的文章顯示:Python 程式語言的學習速度似乎與語言能力呈正比,也就是說:越擅長母語、外語國的語言天才,學習程式語言的速度就越快、對於 coding 知識的吸收越好!

 

Nature:語言天才比數學高手更適合學Python程式語言!誰說文組不能coding?

 

▲ 過往很多人認為理組生較適合學習程式語言。但根據《Nature》旗下期刊發表的研究文章顯示:語言能力強的人學習 Python 較快 (source:unsplash/本圖為示意圖與當事人無關)

 

 

也許,學習 PythonJava 等程式語言的過程,就像是學習英文、德文等第二外語一樣。

根據華盛頓大學研究人員發表的一項研究顯示:從一個人的語言能力及解決問題的能力,就能預測他學習 Python 程式語言的速度快慢。此項研究使用「行為測試」和「大腦活動」的方式,來了解受試者學習程式語言的速度,並同步發表在美國《Nature》旗下自然科學期刊《Scientific Reports》上。

 

Scientific Reports網站截圖

 

▲ 《Nature》旗下期刊《Scientific Reports》發表的研究報告「自然語言能力與學習程式語言的關聯」。(source:擷取自 Scientific Reports 官網)

 

 

這項研究招募了 42 名受試者,他們必須透過 Codeacademy 的線上教學平台,完成 10 次 45 分鐘的 Python 課程。其中真正完成課程的受試者有 36 人,研究團隊就從他們的身上確認其學習速度及對課程的掌握度。

線上課程讓研究團隊能掌握受試者學習進度

在進行線上的 Python 課程之前,受試者進行了一連串數學能力、工作記憶、第二外語及問題解決能力的測試後,才開始進行 Python 程式語言的課程。課程是使用線上的方式,不但讓受試者能自我掌握學習進度,更讓研究團隊能即時追蹤受試者的學習速度及在線上測驗中的表現。
受試者們還在課程結束時,完成期末測驗及一項程式設計任務,讓研究團隊了解他們的 coding 程度與學習吸收度。

那記憶力、問題解決的能力以及數學或語言的能力,又是如何地影響他們程式語言的學習力呢?

研究人員隨後比對受試者們在學習前的測驗結果,以及在學習 Python 課程後的測試表現,以確認他們本身的數學能力、工作記憶、第二外語及解決問題的能力,是否會影響到 Python 課程的學習能力及速度。

受試者以不同的速率學習 Python,並且在研究結束時的 coding 能力也不盡相同。研究團隊發現:學生對 Python 的學習力主要是與一般認知能力(解決問題能力和工作記憶)正相關,而他們的學習速度更與一般認知能力和語言能力有著密切關係。

Python。請點此接續看下去!


相關文章:

【AI在瘟疫蔓延時】台灣 AI「雅婷」化身音樂家 發表首張專輯「武漢肺炎」

【AI在瘟疫蔓延時】AI 大神吳恩達公司最新技術 用AI自動檢測社交距離

【人工智慧預防糖尿病患失明】台大打造人工智慧醫療,診斷視網膜病變準確度達95%

人工智慧釀酒「人生釀造 craft」20、30、40、50 世代都有不同的專屬啤酒

人工智慧心靈雞湯文奪冠!療癒無數學子(上)

人工智慧惡搞哈利波特續集,各個主角下場超悽慘?

人工智慧關心您的健康,不舒服找蘭老師就對了!

 

 

 

 

谷歌運用人工智慧,望助視障人士獨立參加路跑

 

谷歌運用人工智慧,望助視障人士獨立參加路跑

 

谷歌[運用人工智慧系統,未來望助視障人士獨立參加路跑,令人十分期待!

Google 正測試人工智慧系統,助盲人和視障人士獨立參加路跑

Google 正在測試一種人工智慧系統,以幫助盲人和視力障礙人士獨立參加路跑。

研究計畫「Project Guideline」,旨在讓盲人與視障人士擁有更多獨立性,讓他們不需透過其他人或導盲犬輔助即可獨自完成路跑。

▲ 幫助視障人士獨立完成路跑的人工智慧系統「Project Guideline」介紹影片

Google 開發的「Project Guideline」APP 使用人工智慧模型辨識路上的指引線,並推斷跑者是否在指引線上。那要如何使用此系統呢?首先跑者需將手機接在 Google 設計的腰帶、綁在腰上,並且配戴骨傳導耳機。 APP「Project Guideline 」開啟後,即可透過手機內建相機追蹤跑道上的指引線,以判斷跑者的位置。若跑者偏移了指引線,APP 會將提示音發送到骨傳導耳機。當越偏離指引線的左側時,發送到左耳的提示音就會越來越大;反之亦然。此 APP 可在沒有網路的狀況下運作。

 

Google用來訓練指引線模型的影像

 

▲ Google 用來訓練「指引線」模型的影像(source:Google)

 

 

Google 藉由 Thomas Panek (導盲犬訓練非營利組織「Guiding Eyes for the Blind」的 CEO、也是熱愛跑步的人)的協助而開發此系統。Google 正尋求與其他組織合作,在一些社區中建立有指引線的跑道。

近年 Google 推出許多輔助視障人士的工具,如 Google 地圖的語音行走指示,以幫助他們獨立行走、Chrome 的人工智慧能辨識影像並提供說明、Lookout APP 能辨識路上的障礙物並提供語音幫助,還有利用人工智慧幫助視障朋友「看見」世界的 Google AI 眼鏡「EE2」

▲ Envision 與 Google 合作的 AI 人工智慧眼鏡,導入 AI 人工智慧技術,能使盲人和視障人士輕鬆辨識身邊事物

 

 

相關文章:

【AI在瘟疫蔓延時】台灣 AI「雅婷」化身音樂家 發表首張專輯「武漢肺炎」

【AI在瘟疫蔓延時】AI 大神吳恩達公司最新技術 用AI自動檢測社交距離

【人工智慧預防糖尿病患失明】台大打造人工智慧醫療,診斷視網膜病變準確度達95%

人工智慧釀酒「人生釀造 craft」20、30、40、50 世代都有不同的專屬啤酒

人工智慧心靈雞湯文奪冠!療癒無數學子(上)

人工智慧文筆太好,記者憂心飯碗不保(上)

運用人工智慧,你的草圖也能變成栩栩如生的風景圖

利用人工智慧,簡單線條也能變成一幅生動風景圖

 

利用人工智慧,簡單線條也能變成一幅生動風景圖

人工智慧技術太猛了!簡單的線條也能變成栩栩如生的風景圖,很酷!

 

 

 

Nvidia 非常擅長將人工智慧技術用於創造擬真的圖像,像是之前的 StyleGEN 就可以合成幾可亂真的虛擬人臉(雖然合成貓咪有點失敗)。去年他們又出了一款 AI 工具「GauGAN」可將信手捻來的線搞草圖,化為擬真的風景圖。

該軟體使用一種被稱為「生成對抗網絡(GAN)」的人工智慧模型,提供一種被 Nvidia 稱為「智能畫筆(smart paint brush)」的工具。 這意味著用戶只需繪製基本的線條輪廓,軟體可以自動以自然紋理(例如草,雲,森林或岩石)填充,最後一個擬真的自然風景就這樣呼之欲出了!

雖然 Nvidia 的「GauGAN」並非是此類 AI 軟體的創舉,但是生成的效果讓人讚為觀止——該人工智慧軟體可讓用戶以極其直觀的方式,生成幾可亂真的景觀。例如,當用戶隨性繪製一棵樹,然後在其下繪製水池時,AI 模型還可將樹的倒影添加到水池中呢!

儘管 Nvidia 提供的 demo 看起來很強大,但是 GauGAN 仍有他的限制。因為生成草地、水等自然物質所涉及的視覺模式是非結構化的。相比之下,生成建築物和家具的圖片要復雜得多,而且結果也差強人意——那是因為這些物體涉及到人類敏銳的邏輯和結構。正如之前我們所看到的 Nvidia 人工智慧生成人臉,雖然 GAN 可說是表現的有模有樣,但這也是拜大量的額外工作所賜。

而 Nvidia 也未透露是否有任何讓該軟件商品化的計畫,但暗示這樣的工具將來可以幫助「建築師、城市規劃師、園藝設計師和遊戲開發商的從業人員」。

NVIDIA 應用深度學習研究部門副總裁 Bryan Catanzaro 表示:「使用簡單的草圖來集思廣益做設計,是要容易得多了!並且該技術能將草圖轉換為高擬真的圖像。」

 

 

 
 

美術課救星!人工智慧幫你巧筆變身大師畫!

 

美術課救星!人工智慧幫你巧筆變身大師畫!

人工智慧幫你化腐朽為神奇,沒畫畫天分免驚,巧手秒變名畫!


人工智慧繪圖工具 Chimera Painter 將粗略草圖化為精細的怪獸插圖

 

▲ Google 新推出的機器學習工具「Chimera Painter」,展現了人工智慧輔助繪圖能力(Image: Google)

 

 

Google CEO Sundar Pichai 曾說人工智慧人類的影響「比火、電更為深遠(AI is more profound than fire or electricity.)」。

這邊有個有力的證據,來支持上述的說法: Google 研發了一套人工智慧工具,能將平常不過的塗鴉,變成詭異的怪物。還有什麼比這影響更深遠的?

 

 

▲ 使用粗略草圖即可生成奇幻生物的人工智慧工具:Google 的 Chimera Painter

 

 

無論如何,這聽起來就是很有趣。這套工具叫做「Chimera Painter」,它能根據用戶的粗略草圖,使用機器學習方式,生成進一步的精緻圖像。這樣的生態已逐漸成為機器學習界的常態:先前 Nvidia 推的 AI 工具「done it with landscapes」能將線條草圖生成擬真背景、MIT 與 IBM 也合作過將粗略線條生成擬真建築物的「GANpaint」,而現在 Google 也出了類似的人工智慧工具用來生成 … 怪物。

Chimera Painter 背後的團隊在他們的部落格網站說明這套工具的概念是創建一支「不像工具、而更像助手的畫筆」。Chimera Painter 只能算是一個原型,但是若類似的軟體普及化後,則可大大地縮短創作高品質藝術作品所需的時間。

 


不會畫怪物也ok!人工智慧幫你把小畫家3歲塗鴉,變成大師奇幻插畫

 

▲ Google 的人工智慧研究人員發想的奇幻遊戲卡原型(Image: Google)

 

 

Google 的人工智慧研究人員們給自己一個挑戰:發想奇幻風格的遊戲卡片,卡片玩家可結合不同的怪物卡來戰鬥,就像寶可夢的玩法一樣。研究團隊用來訓練機器學習模型的資料庫,擁有破萬隻怪獸的資料。這些怪獸本身是使用遊戲開發引擎「Unreal Engine」,一個部位接著一個部位地使用 3D 模型渲染生成。每一張圖像都匹配到一個「分割圖」 ──將怪物分為爪、口鼻、腿等身體部位的覆蓋圖。

訓練了這個機器學習模型後,用戶就可依照怪物的身體部位,繪製線條草圖。每一部位的線條草圖都被視為分割圖,然後用對應的逼真紋理進行渲染。如果你載入了 Chimera Painter,就會看到一些預設的怪物,並且牠們身體各個部位可說是接合的天衣無縫。但是,當你自己繪製時,假如身體的部分沒有接合或匹配好,所生成的怪獸恐怕是七零八落。以下的影片即為失敗的範例:

 

 

▲ 使用 Chimera Painter 繪製怪物失敗的案例

 

 

 

 相關文章:

【AI在瘟疫蔓延時】台灣 AI「雅婷」化身音樂家 發表首張專輯「武漢肺炎」

【AI在瘟疫蔓延時】AI 大神吳恩達公司最新技術 用AI自動檢測社交距離

【人工智慧預防糖尿病患失明】台大打造人工智慧醫療,診斷視網膜病變準確度達95%

人工智慧釀酒「人生釀造 craft」20、30、40、50 世代都有不同的專屬啤酒

人工智慧心靈雞湯文奪冠!療癒無數學子(上)

人工智慧文筆太好,記者憂心飯碗不保(上)

人工智慧狂電人類玩家!前西洋棋冠軍聯手AI改寫西洋棋(上)

 

人工智慧翻玩西洋棋,是毀滅還是創造?(下)

 

 

人工智慧翻玩西洋棋,是毀滅還是創造?(下)

 
人工智慧與前西洋棋冠軍聯手翻完西洋棋規則,讓遊戲更好玩(下)

前世界冠軍與人工智慧讓西洋棋起死回生

經過雙方的合作研究,最終於 2020 年 9 月發表一篇長達98頁的論文:《使用 AlphaZero 評估遊戲平衡:探索西洋棋中的替代規則》(Assessing Game Balance with AlphaZero: Exploring Alternative Rule Sets in Chess),由 Deepmind 的 Nenad Tomasev、Ulrich Paquet、Demis Hassabis 以及克拉姆尼克一同撰寫。

在此篇論文中,團隊發表了九種西洋棋變體型式,AlphaZero 則負責在幾個小時內模擬出數十年遊戲會怎麼發展、探索不同規則的西洋棋具有什麼樣的可能性。有 AlphaZero 的助力,使研究團隊能看到在不同規則下的人類玩家能開創出什麼別出心裁、出乎意料的玩法。

AlphaZero 測試出的九種西洋棋變體規則:

  1. 禁止「國王入堡」(No-castling):整個棋局都禁止使用「國王入堡」走法。這種走法讓棋國王躲進由其他棋子組成的防護後面,減少國王被威脅的機會,但也會令比賽變得沉悶。
  2. 10 步內禁止「國王入堡」(No-castling (10)):在前10步以內禁止使用「國王入堡」下法。
  3. 兵走一格(Pawn one square):兵棋(Pawn)只能前進一格。目標為增加彈性,減緩遊戲速度。
  4. 無子可動時即勝(Stalemate=win):其中一方無子可動時,即為另一方勝利(原先為平局)。
  5. 水雷(Torpedo):兵可以選擇在棋盤的任何地點走 1 或 2 格。這意味著隨時都可以使用吃過路兵(En passant)走法。
  6. 半水雷(Semi-torpedo):兵只有在第 2 或 3 線時才能移動 2 格。
  7. 兵可以後退(Pawn-back)棋子可以向後移動到一個正方形內的格上,只能返回到 2nd/7th 橫線上(此時的移動不計入「50步規則」內)。
  8. 兵可以橫走(Pawn-sideways):棋子也可以橫向移動一格。(此時的移動不計入「50步規則」內)
  9. 自己吃棋(Self-capture):可以吃自己的棋子,用自己的棋子開路。

 

 

1123-3.png

 

▲ 在 AlphaZero 的幫助下,研究團隊設計出引人入勝西洋棋變體規則。(Photo by chess.com)

 

 

克拉姆尼克說,如果大家願意對既定規則做出一些小小的改動的話,一幅令人著迷的西洋棋新圖景就有可能展現。「人類已經玩了1500年的西洋棋了,調整規則不是什麼新鮮事,抱怨電腦讓這個遊戲變的無聊也不算新鮮。」

論文共同作者之一的 Nenad Tomasev 表示:「開發西洋棋 AI 目的一開始是想看看人工智慧能不能打敗人類。現在,像 AlphaZero 這樣的人工智慧將會跟人類一起探索西洋棋的創造性,而不是讓人類成為AI的手下敗將。」

這是 AI「獻給西洋棋界的禮物」

AlphaZero 早已展示了它無師自通、自我學習的能力,而研究團隊便物盡其用、借助它來更快地探索西洋棋的新玩法,而不是像過去人類折騰了幾十年、甚至幾個世紀,才摸清楚這個複雜遊戲的美麗與缺陷。Nenad Tomasev 對此表示:「你當然不希望自己花了幾個月、甚至幾年才摸清楚這個遊戲,卻意識到『噢,不,這遊戲一點都不美。』」

同時,AlphaZero 不會受到傳統的棋藝理論束縛,而會發展自己的直覺與策略,帶來全新的想法,顛覆了長久以來人類對這些棋藝遊戲的思考。

克拉姆尼克從他們與AI一起建立的新規則中看到了令人振奮展望,例如「可以吃自己的棋子」(self-capture)是極端的新規則,克拉姆尼克說,這條規則實際上會讓棋手有更多可能,例如選擇犧牲一顆棋子來取得優勢。「總而言之,這只會讓遊戲變得更加美麗。」

AI會毀滅西洋棋嗎?克拉姆尼克與DeepMind告訴我們不會,並且人類可以與AI並肩作戰、開拓出嶄新的可能。若沒有人工智慧的助力,或許就難以達成這個願景了。


相關文章:


【AI在瘟疫蔓延時】台灣 AI「雅婷」化身音樂家 發表首張專輯「武漢肺炎」

【AI在瘟疫蔓延時】AI 大神吳恩達公司最新技術 用AI自動檢測社交距離

【人工智慧預防糖尿病患失明】台大打造人工智慧醫療,診斷視網膜病變準確度達95%

人工智慧釀酒「人生釀造 craft」20、30、40、50 世代都有不同的專屬啤酒

首位人工智慧法官即將上任,它真能公正判決嗎(上)

人工智慧文筆太好,記者憂心飯碗不保(上)

人工智慧自駕試車基地,日本首家駕訓班


人工智慧翻玩西洋棋,是毀滅還是創造?(上)

 

人工智慧翻玩西洋棋,是毀滅還是創造?(上)

人工智慧與前西洋棋冠軍聯手翻完西洋棋規則,讓遊戲更好玩(上)

以西洋棋賽為主題的 Netflix 影集《后翼棄兵》近來大受好評,其中刺激精彩的棋局對弈,不但讓這齣劇高佔台灣熱門排行榜第一名,也讓原本對西洋棋不了解的觀眾產生興趣、紛紛探查起這個歷史悠久的二人對弈遊戲。而西洋棋——這個世界上最流行的遊戲之一,現在正遭受人工智慧的破壞與威脅?而前西洋棋世界冠軍又正和 AI 聯手拯救西洋棋?

 

 

人工智慧狂電人類玩家!前西洋棋冠軍聯手AI改寫西洋棋(上)

 

▲ 現在的西洋棋比賽,贏家幾乎都是人工智慧。(Photo by Felix Mittermeier on Unsplash)

 

 

人工智慧與西洋棋的愛恨情仇

西洋棋在世界各地有數以百萬計的粉絲,而編寫出一個能與人類對弈的軟體程式,曾是科學家追求的目標。

首個挑戰人類棋王的電腦系統為 1997 年 IBM 的「深藍」(Deep Blue),更成為首個在標準比賽時限內擊敗人類冠軍的電腦系統。其後依然有數次「人機大戰」,但人類始終難以在 64 格的天地裡戰勝電腦。

人工智慧公司 DeepMind 的 AlphaZero 登場時,AI 只是憑藉自我對弈的不斷學習,在完全沒有輸入人類的棋譜、沒有特別設計的專用計算程式的情況下,就已經征服西洋棋、將棋、圍棋等最複雜的棋類遊戲,打敗這些領域中最頂尖的人類玩家了。

在科學家們將 AlphaZero 稱為「深度學習 AI 的終極解答」、欣喜於人工智慧技術的快速進步時,另一方面也有人開始擔憂 AI 正在毀滅這些棋類遊戲——因為棋手們開始死記硬背 AI 的下棋手法來擊敗對手,讓棋類遊戲失去了原先的美麗。

前西洋棋世界冠軍克拉姆尼克就是憂心忡忡的其中一人。不過,他現正與開發 AlphaZero 的DeepMind團隊合作,嘗試開發出西洋棋的若干變種形式,試圖找回棋類遊戲的迷人風采。

64 個方格構成無限可能的世界

 

 

1123-2.jpg

 

▲ 西洋棋下棋示意圖(Photo by JESHOOTS.COM on Unsplash)

 

 

曾為世界冠軍多年的俄羅斯職業棋手弗拉基米爾.克拉姆尼克(Vladimir Kramnik)認為,西洋棋也是一門美麗的藝術。思維在棋盤上彼此碰撞,優雅而又複雜的挑釁、反擊、你來我往——「這是一種創造。」克拉姆尼克這樣表示。

克拉姆尼克熱愛西洋棋,他於 2000 年至 2007 年間坐擁世界西洋棋冠軍的寶座,在國際西洋棋奧林匹克上獲得了三枚團體金牌和三枚個人獎牌。儘管如此,克拉姆尼克依然還是決定退休。他於去年宣布退出西洋棋比賽,表示自己心愛的棋類遊戲變得越來越缺乏創造力了。

他認為部分原因需歸咎於科技,因為電腦欠缺靈魂的計算,打造出一個龐大的開局、進攻和防守的下法資料庫,人類選手便開始死記硬背這些下法。「即使是在最頂級的比賽當中,常有將近一半、甚至是整場比賽的下法都是靠記憶走完的。你甚至都沒有自己的下法,全都是電腦的下法。」

即使對現狀感到憂慮,但克拉姆尼克並未放棄希望。他設想了幾種讓西洋棋革新的方變體規則,並與「敵人」──也就是開發出 AlphaZero 的 DeepMind 團隊合作,讓研究人員向這個超人玩家 AlphaZero 發起挑戰,看後者能不能學習選擇出來的九種西洋棋的變體,進而讓棋手進入到富有創新、創造力的新模式。

人們學習 Python 的速度,語言能力的影響比例約有 20%,而數學能力的影響卻只有 2%?真相請見下一篇文章!請點此接續看下去!

 

 相關文章:


【AI在瘟疫蔓延時】台灣 AI「雅婷」化身音樂家 發表首張專輯「武漢肺炎」

【AI在瘟疫蔓延時】AI 大神吳恩達公司最新技術 用AI自動檢測社交距離

【人工智慧預防糖尿病患失明】台大打造人工智慧醫療,診斷視網膜病變準確度達95%

人工智慧釀酒「人生釀造 craft」20、30、40、50 世代都有不同的專屬啤酒

人工智慧心靈雞湯文奪冠!療癒無數學子(上)

人工智慧文筆太好,記者憂心飯碗不保(上)

日本人工智慧釀酒,人生各個時期的專屬啤酒(下)


人工智慧一眼抓超速!世界最快偵測技術在台灣(下)

 

 

人工智慧一眼抓超速!世界最快偵測技術在台灣(下)

什麼都逃不過人工智慧的法眼!據說秒抓超速世界最快(下)

本系列文章為【AI一眼抓超速!中研院開發世界最快偵測技術YOLOv4 】的下篇,請點此看本系列文章上集。

不只最快,還要最精準!

2019 年年初,廖弘源與王建堯團隊首先研發出局部殘差網路 PRNet(partial residual networks, PRNet),將資訊「分流」,減少無謂的計算量,使運算速度增加兩倍。「一開始做出 PRNet,我還是覺得效果不夠好。雖然減少計算量,大幅加快了人工智慧計算的速度,但是正確率和原本相比並沒有什麼提升。」廖弘源自信的說:「我覺得這樣沒什麼意思,因為我們的目標,是做出全世界最好的物件人工智慧偵測技術!」

2019 年 11 月,他們在 PRNet 的基礎上,緊接著研發出跨階段局部網路 CSPNet(cross stage partial network, CSPNet),利用分割–分流–合併的路徑,成功達到了大幅減少計算量、卻能增加學習多元性的目標。

從 PRNet 與 CSPNet,我們一步步把物件偵測的計算量減低,但是學習卻能更多元,因此也得到更好的精確度。

 

1117-4.jpg

▲ 以上為 CSPNet 簡化結構的一部分,三色箭頭代表機器學習過程中,後面的資料如何反饋往前傳。這個設計的重點在於資訊的分流與多了過渡層 (Transtion),讓反饋的學習資訊在分流後產生差異,提高每一網路層參數的利用率,目標是讓機器學到更多樣的東西,提高判斷的精確度。另一方面,因為資料分流的關係,有部分直接往後傳,不經過分析計算,使整個計算量變少,運算速度也因此加快。(圖:研之有物、Source:王建堯)

 

「我們發表 CSPNet 之後,吸引 YOLO 技術的維護者博科夫斯基(Alexey Bochkovskiy)的注意。」廖弘源說。他們很快與博科夫斯基(Alexey Bochkovskiy)展開合作,將 CSPNet 用於開發新一代的 YOLO,並於今年 4 月發表了 YOLOv4 ,成為當前全世界最快、最準的物件偵測技術,引爆全球的 AI 社群。廖弘源笑說:「我們 4 月發表的論文,短短不到三個月,閱讀次數就超過了 1400 次,比我以往發表的任何論文都還多。」其中的關鍵技術正是 CSPNet。

此外,由於 YOLOv4 的技術是開放的,各式各樣的應用也如雨後春筍般快速出現。舉例來說,YOLOv4 可即時偵測人們的社交距離,或是快速判斷路上的行人有沒有戴口罩。

▲ 計算社交距離

YOLOv4 甚至能辨識並捕捉滑雪運動中的人,廖弘源進一步解釋:「滑雪的人姿勢以及運動軌跡都不斷變換,甚至可能拋物線飛起,偵測難度相當高,但 YOLOv4 都能追蹤得非常精準。」

▲ 捕捉滑雪運動的人

帶學生的第一要求:把科學帶進來!

中研院資訊所所長廖弘源長期研究多媒體視訊處理,從雞尾酒浮水印到人臉資料庫、數位化影片修補等,再到這次的 YOLOv4 物件偵測技術,研究成果卓越。而每一項成果的後面,都是廖弘源帶領資訊所前後屆學生一起努力的成果。

想在廖弘源的實驗室工作,可不是件輕鬆的事。他說:「做研究,不該只想著工程問題,應該本著科學家的精神,從中找出最具科學價值的關鍵下手。」許多學生一到廖弘源的實驗室,必須將過去狹隘、僵化的工程解題模式打掉重練,重新以科學看待問題。例如:本次 YOLOv4 的成功關鍵,即在於一開始問了個好問題,找到最值得改善的環節。

不論面對的是何種問題,我的第一個要求,就是把科學帶進來。

儘管治學甚嚴,個性海派的廖弘源和學生也有著亦師亦友的關係。他喜歡和學生一起找出好的研究議題後,一起埋首投入研究工作的熱血感,也喜歡在研究遭遇瓶頸時,與學生一起「大吃一頓解憂愁」。如今,他的學生遍布國際級知名公司與研究單位,持續發揮「廖式思考」的深刻影響力,開發更多如 YOLOv4 般頂尖的科研成果。

雖然團隊屢屢創造具商機的研究成果,但廖弘源對於獎項或是申請專利等,卻是看得很淡。「我的目的本來就不是賺錢,」廖弘源說:「我只希望我們對世界的好奇與探索,能真正轉化為對人類的貢獻。」

 

1117-5.jpg

▲ 中研院記者會合影。由左到右,義隆電子葉儀皓董事長、中研院周美吟副院長、中研院資訊所廖弘源特聘研究員、中研院資訊所王建堯博士後研究員、科技部前瞻司楊琇雅司長、台大人工智慧研究中心陳信希主任、杜維洲執行長。(圖:研之有物、Source:中研院秘書處)

 

推薦閱讀:

(作者:郭雅欣、黃曉君;本文由 研之有物 以創用 CC 姓名標示–非商業性–禁止改作 4.0 國際 授權條款釋出。)


相關文章:

【人工智慧預防糖尿病患失明】台大打造人工智慧醫療,診斷視網膜病變準確度達95%

人工智慧釀酒「人生釀造 craft」20、30、40、50 世代都有不同的專屬啤酒

【AI在瘟疫蔓延時】台灣 AI「雅婷」化身音樂家 發表首張專輯「武漢肺炎」

【AI在瘟疫蔓延時】AI 大神吳恩達公司最新技術 用AI自動檢測社交距離

PTT之父因喪母之痛,打造人工智慧預測敗血病

人工智慧惡搞哈利波特續集,各個主角下場超悽慘?

人工智慧機器人研發者-Nils Nilsson辭世

人工智慧一眼抓超速!世界最快偵測技術在台灣(上)

 

什麼都逃不過人工智慧的法眼!據說秒抓超速世界最快(上)

什麼都逃不過人工智慧的法眼!據說秒抓超速世界最快(上)

 

1117-1.jpeg

(Source:pixabay)

 

YOLOv4 創生故事

「只要讓我看一眼,我就知道這是什麼!(You Only Look Once, YOLO)」YOLO,是目前當紅的人工智慧物件偵測演算法。中研院資訊科學研究所所長廖弘源及博士後研究員王建堯,與俄羅斯學者博科夫斯基(Alexey Bochkovskiy)共同研發最新的 YOLO 第四版(簡稱為 YOLO v4),一舉成為當前全世界最快、最高精準度的物件偵測系統,引爆全球人工智慧技術社群,已然改寫物件偵測演算法的發展。究竟,他們在演算法裡動了哪些手腳?又是什麼樣的契機,開啟了這項研究?

產業出難題,學界來解題

故事,是從一項產學合作開始。前幾年,科技部提出了「產學共創」機制:產業出題、學界解題,中研院合作對象義隆電子,出了一個考題給資訊所:如何增進十字路口的交通分析?也就是即時偵測車流量、車速等等。當時義隆電子已經在十字路口架設了監視器,包括全景攝影機及單一方向的槍型攝影機,接下來最需要的,就是辨識車輛的物件偵測技術。

「但我們需要的不只是辨識車輛而已。」王建堯說。在馬路上運行中的車速度很快,物件辨識必須非常即時,在短時間內就能辨識出車輛,並能持續追蹤,計算車速。換句話說,這個技術對物件的偵測必須「快、狠、準」。此外,因為影像資料不斷產生,如果把資料都上傳雲端運算,不但比較耗時,也會給雲端電腦帶來太大的負擔,因此這個偵測技術還得做到一件事──計算量必須夠小,小到可裝在十字路口監視器上的小型計算器, 即可完成物件偵測的任務。

要做到交通路況的即時分析,必須有一種速度快、仍能精準辨識,但又可應用在生活中小型計算器的物件偵測技術。

YOLOv4 演算法達到這個不可能的任務!它是目前世界最快、最精準的物件偵測演算法,卻又能小到放在十字路口的監視器內,已實際應用於如「智慧城市交通車流解決方案計畫」,即時偵測車輛、停等車列、車速等等 。

物件辨識的阿基里斯腱:梯度消失問題

怎麼辦到的?首先,王建堯著手研究著名物件偵測系統 YOLOv3 ,「我們想找出在建立一個物件偵測系統時,哪一個步驟是最關鍵的?如果改善了,效率和精確度會提升最多?」廖弘源強調:「雖然是工程問題,但我們要把科學思考帶進來。」

先來認識物件偵測技術!它是個卷積神經網路(Convolutional Neural Network, 簡稱CNN),具有許多網路層,每一層負責抽取某些圖像特徵。一個輸入的影像通過層層層層層層……分析,最後找出最可能的答案。理論上,層數越多、判斷結果應該越精確。

 

1117-2.jpg

▲ 先教電腦定義每個影像的值,再透過神經網路的層層非線性函數運算,判斷影像最可能為哪個數字,信心水準比值最高者為答案。(圖:研之有物、Source:李宏毅)

 

訓練這個卷積神經網路的方法是:先倒入大量已標記正確答案的學習材料 (如標記好各種車輛的圖片),讓機器學習如何判斷。每次機器判斷結果與正確答案不符,就將這個資訊反饋到前面的網路層,調整每一層的參數,以期下次達到更準確的判斷。

那麼,哪一步改善後可以大幅提升表現呢?王建堯找到的關鍵是:學習的反饋過程。當卷積神經網路的網路層數愈多,在訓練階段,因為反饋計算方式,每回傳一層就會損失一些資訊,越前面的網路層學習到的東西越少,稱為「梯度消失問題」(vanishing gradient problem)。

為了解決梯度消失問題,前人曾經提出 ResNet、DenseNet 等卷積神經網路,簡單來說,即是將後面資料備份後往前「跳級」傳遞。以 ResNet 為例,可想像成「含水傳話」,從最後一個人往前傳,愈前面的人資訊愈缺失。但如果最後一層開始,每層都備份錄音,再把錄音跳過一層直接往前傳,那麼前面所有層都可接收資訊,前面網路層就不會學不到東西。

 

1117-3.jpg

▲ 上圖為原始的卷積神經網路 (CNN) ,假設只有三層,在資料回傳的過程中會逐層遞減,稱為梯度消失問題。下圖為改良版 ResNet ,從最後一層開始,每一層都備份,再把備份越過一層「跳級」傳遞,前面網路層就能接收到後面的資訊。(圖:研之有物、Source:王建堯)

 

然而,ResNet 具有太多重複的拷貝,不但浪費計算量,而且不同層的參數用來學習重複、但多餘的資訊,換句話說,每一層能學到的東西都差不多。「是否有一種更好的方式,在不改參數量,讓機器運算變快,省下來的資源 (參數) 還能讓機器多學一點,提高精確度?」廖弘源說。


別急著跳出!請點此看本系列文章下集。

(作者:郭雅欣、黃曉君;本文由 研之有物 以創用 CC 姓名標示–非商業性–禁止改作 4.0 國際 授權條款釋出。)


相關文章:

【人工智慧預防糖尿病患失明】台大打造人工智慧醫療,診斷視網膜病變準確度達95%

人工智慧釀酒「人生釀造 craft」20、30、40、50 世代都有不同的專屬啤酒

【AI在瘟疫蔓延時】台灣 AI「雅婷」化身音樂家 發表首張專輯「武漢肺炎」

【AI在瘟疫蔓延時】AI 大神吳恩達公司最新技術 用AI自動檢測社交距離

首位人工智慧法官即將上任,它真能公正判決嗎(上)

人工智慧惡搞哈利波特續集,各個主角下場超悽慘?

人工智慧機器人研發者-Nils Nilsson辭世


'聽聲''看診!人工智慧靠聲音辨識多種疾病(下)

 

'聽聲''看診!人工智慧靠聲音辨識多種疾病(下)

人工智慧聽聲辨認是否為新冠患者的新技能,成功率據說達98.5%(下)

AI 檢測咳嗽時異音 找出 COVID-19 無症狀感染者

而在疫情爆發後,研究團隊開始將此技術運用在新冠病毒的篩檢上。團隊一共收集了多達7萬個聲音樣本,來訓練即將迎戰新敵人的人工智慧模型,每個樣本皆包含數次咳嗽的聲音,其中有2500個樣本來自於確診者。蘇比拉納表示:「在醫療領域,這是迄今為止最大的咳嗽數據庫了」。

接著團隊在 1,000 個樣本上測試此 AI 模型,其中樣本有一半為健康者的咳嗽聲,另一半為確診肺炎者的咳嗽聲。在測試中,人工智慧準確地辨識出 98.5% 的確診患者,且辨識出 100% 的無症狀感染者,展現令人歎為觀止的準確性。

 

1116-3.jpg

▲就算是新冠患者未表現出圖中的症狀,人工智慧演算法仍可從咳嗽聲辨識無症狀感染者。 (示意圖,與本事件無關/Photo by UN Response to COVID-19 on Unsplash)

 

 

論文共同作者之一的蘇比拉納表示:「即使患者看似無症狀,一旦染上 COVID-19,其產生聲音的方式也會發生變化。」但他同時也強調,雖然該 AI 能夠檢測出不健康的咳嗽聲,但依然需謹慎使用,因為該工具是以「篩選條件」的方式找到相符的疾病,因此也可能出現偶然地完全符合篩選條件,卻不是 COVID-19 的狀況,不論是個人或醫療人員都須謹慎判斷。

團隊盼推出檢測 APP 民眾在家也可免費自我篩檢

 

1116-4.jpg

▲團隊盼能開發出應用此 AI 的免費應用程式。 (Photo by Brian McGowan on Unsplash)

 

目前團隊正在與多家醫療機構合作,以利建立起更多元的數據庫,使預測更精準。

除此之外,研究團隊也正嘗試開發出應用此 AI 的免費應用程式,如果獲得 FDA(美國食品和藥物管理局,Food and Drug Administration)的許可,接下來團隊將會與私人企業合作,開發手機 APP。該 APP 將可能成為一個免費、便捷、居家性的病毒預先篩檢工具,特別是能夠識別出無症狀感染者。使用者可以將咳嗽聲以手機錄製後,上傳提供 AI 分析,就能得知是否有被感染的可能性,再進行正式的新型冠狀病毒篩檢。

蘇比拉納表示:「如果每個人在去教室,工廠或餐廳之前都使用該診斷工具,則該組診斷工具的有效實施可以減少大流行的傳播。」

長期關注人工智慧相關議題的作家和演講家卡倫姆‧柴斯(Calum Chace)表示,這個能通過咳嗽聲音辨認新冠病毒疾病的演算法是「AI 人工智慧的經典範例」,他過去也曾就 AI 對人類帶來的衝擊提出警告,但這一次柴斯表示:「這是運用 AI 幫助人類的一個好例子,單就這件事來看,我看不出 AI 會帶來什麼危險。」

也許,AI 將能成為阻止疫情擴散的最大助力之一。


相關文章:

【人工智慧預防糖尿病患失明】台大打造人工智慧醫療,診斷視網膜病變準確度達95%

人工智慧釀酒「人生釀造 craft」20、30、40、50 世代都有不同的專屬啤酒

【AI在瘟疫蔓延時】台灣 AI「雅婷」化身音樂家 發表首張專輯「武漢肺炎」

【AI在瘟疫蔓延時】AI 大神吳恩達公司最新技術 用AI自動檢測社交距離

首位人工智慧法官即將上任,它真能公正判決嗎(上)

這個國家即將任用人工智慧法官,它真能公正判決嗎(下)

人工智慧創作冠軍心靈雞湯文,療癒許多學子們(下)

'聽聲''看診!人工智慧靠聲音辨識多種疾病(上)

 

'聽聲''看診!人工智慧靠聲音辨識多種疾病(上)

 

人工智慧聽聲辨認是否為新冠患者的新技能,成功率據說達98.5%(上)

人工智慧現在可從人的咳嗽聲中,認出對方是否為新冠肺炎患者──就算是無症狀患者,也能被辨識出。在目前全球疫情尚未趨緩之際,AI 可說是為新冠病毒的檢測帶來新希望!

美國麻省理工學院(MIT)實驗室日前發表一篇論文,表示他們開發出的最新 AI 演算法,只要聽到人的「咳嗽聲」,就能知道這個人有沒有感染新型冠狀病毒。重要的是──這個方法對檢測出無症狀患者特別有用。

 

1116-1.jpg

▲ MIT 新開發的人工智慧演算法,光聽咳嗽聲就能辨識新冠患者──包含無症狀患者。(示意圖,與本事件無關/Photo by UN Response to COVID-19 on Unsplash)

 

 

新冠疫情依然在全球多國延燒,有越來越多證據顯示,在新冠病毒感染者中「無症感染者」佔了相當大的比例。這些沒有發燒、咳嗽、四肢無力等明顯特徵的無症狀感染者,因接受檢測的機會遠遠小於有症狀的感染者、難以及早接受治療,故可能持續傳染給他人,成為疫情防堵的最大威脅。

而近日,麻省理工學院(MIT)實驗室公開表示,他們利用 AI 成功開發出一種冠狀病毒檢測的新方法。

該方法的關鍵是分析人的「咳嗽聲」。MIT 研究人員在電氣電子工程學會(IEEE)的《醫療生物工程》(Engineering in Medicine and Biology)期刊上發表一篇論文,文中表示他們發現無症狀感染者發出的咳嗽聲、與身體健康的一般人有所不同,或可幫助協助辨識出感染病毒的患者,使預篩變得更加容易。雖然人耳無法辨認這種細微的差異,但人工智慧 AI 可以。

在此篇論文中,研究人員明確表示,他們已經開發出一種能辨識新冠肺炎患者咳嗽聲的 AI。

「聽聲」看診 人工智慧靠聲音辨識多種疾病

其實在疫情開始流行之前,研究團隊已著手開發能分析咳嗽異聲的 AI。當時的目標是一望能診斷出肺炎、哮喘和阿茲海默症等疾病。

麻省理工學院自動識別實驗室的研究科學家、同時也是此次論文共同作者之一的布萊恩‧蘇比拉納(Brian Subirana)已證明咳嗽異聲可以幫助預測阿茲海默症。由於新冠肺炎與阿茲海默症有某些相同的症狀,因此團隊便思考是否能將此技術應用至疫情檢測上。蘇比拉納表示:「感染新冠病毒疾病之後,就算是沒有出現任何症狀,你發出聲音的方式也會變得不一樣了。」

 

1116-2.jpg

▲新冠患者就算是無症狀,發出的咳嗽聲也會與一般人不同。人類無法辨識其不同之處,但人工智慧可以。(示意圖,與本事件無關/Image by Mary Theresa McLean from Pixabay)

 

 

研究團隊訓練了稱為「ResNet-50」的神經網絡,用 1000 多個小時的語音資料集訓練,以辨識區分不同強度的聲音。有研究成果表示,聲似「mmmm」的發音可以顯示出一個人聲帶肌肉的狀況,AI 可以根據其中細微的不同,判斷出是否有呼吸道症狀。

之後,團隊訓練了第二個 AI 模型,用來區分言語中明顯的情緒狀態。因罹患疾病、神經系統較脆弱的人,表現出沮喪、憂鬱比表達快樂的頻率更高。研究人員是透過蒐集演員表演的資料集來開發出「語音情緒分類器」的模型,讓 AI 得以辨識如平靜、快樂和悲傷等從聲音流露出的情緒。

接著,研究團隊訓練了第三個 AI 模型,專門辨別肺部和呼吸功能的變化。

最後,該團隊將這三個模型結合在一起,並多編寫一種檢測肌肉退化的演算法。團隊試用這組結好的 AI 模型,辨識包括阿茲海默症患者在內的人聲錄音。他們發現,與舊有的 AI 相比,新 AI 可以更好地識別出患有阿茲海默症的聲音樣本。

結論表明,聲帶減弱、語言情緒、肺活量、呼吸功能以及肌肉退化這四個面向是診斷的要點,同時也可用來檢驗是否罹患 COVID-19。

別急著跳出!下一篇文章即將介紹人工智慧如何從咳嗽辨識無症狀患者。請點此接續看下去!


相關文章:

【人工智慧預防糖尿病患失明】台大打造人工智慧醫療,診斷視網膜病變準確度達95%

人工智慧釀酒「人生釀造 craft」20、30、40、50 世代都有不同的專屬啤酒

【AI在瘟疫蔓延時】台灣 AI「雅婷」化身音樂家 發表首張專輯「武漢肺炎」

【AI在瘟疫蔓延時】AI 大神吳恩達公司最新技術 用AI自動檢測社交距離

首位人工智慧法官即將上任,它真能公正判決嗎(上)

這個國家即將任用人工智慧法官,它真能公正判決嗎(下)

人工智慧創作冠軍心靈雞湯文,療癒許多學子們(下)

人工智慧醫療的各種新知報你知(下)

 

人工智慧醫療的各種新知報你知(下)

人工智慧結合醫療應用,其診斷軟體可望降低視網膜病變,預防患者的失明風險.

本系列文章為【台大打造人工智慧醫療,診斷視網膜病變準確度達95% 】的下篇,請點此看上篇閱讀了解人工智慧如何應用於預防糖尿病患失明。

1112-1.jpg

 

三方跨界合作 造就台灣智慧醫療里程碑

這次的人工智慧診斷軟體的開發得益於跨界合作。

宏碁使用深度學習技術訓練 AI 模型,透過蒐集國外 EyePACS 平台臨床、國內臺大醫院臨床共數萬名糖尿病視網膜病變患者的「眼底資料」──彩色眼底檢查影像及診斷結果等資料數據,來訓練 AI。之後結合硬體整合成邊緣裝置(edge device),使 AI 無須網路即可進行篩檢判讀,在速度、資料安全性和隱私性方面益處良多。

訓練好的 AI,則與醫療製藥公司「台灣諾華」共同設計、委由臺大醫院執行臨床試驗,並在試驗結果上取得敏銳度達 95%的佳績,已接近視網膜專科醫師的判讀準確度。

另外,在開發與試驗期間,食藥署提供專案輔導長達一年,提供專業法規意見、深入溝通並嚴格審查,最後才交出這張台灣第一張醫療器材軟體認證,顯示出政府對於台灣醫療環境及智慧醫材的重視。這次的認證更是打破傳統模式,從台灣本土出發,就地取材。

 

1112-2.jpg

▲ Photo by Online Marketing on Unsplash

 

 

在成果效益上,這套人工智慧診斷軟體可有效輔助醫師找出潛在的糖尿病視網膜病變患者,及早發現並進行治療,協助控制病情,更降低病人等候報告的時間。

而宏碁也已與台灣諾華簽訂合作備忘錄,未來將運用人工智慧技術、共同攜手耕耘智慧醫療領域,整合雙方專業人才與軟硬體技術,朝提升醫療效率、精準率的目標邁進。宏碁表示,將會瞄準黃斑部退化、糖尿病視網膜病變及心血管疾病等領域,打造合適的 AI 輔助工具,讓台灣醫療產業升級轉型。

 

醫療產業轉型 人工智慧醫療商機不斷

全球醫療照護產業正在面臨轉型,如何將醫療場域數位化、智慧化都將是一大挑戰;如何透過科技技術,將傳統醫療「疾病發展後治療」的思維轉換成「注重預防、防治結合」,也是未來須面對的難題。

要攻克這些問題,需要創新、洞察與有效的行動方案,才能創造出「高效互通的資料」與「開放和安全的平台」,最後打造出「以消費者為導向的醫療照護」環境。

台灣的全民健保制度不但保費低、給付多、管理成本低,大幅減輕民眾看病求醫的障礙,讓台灣累積起了大量健保數據資料,這一優勢加上台灣高度發展的資通訊高科技產業,更是擁有發展 AI 智慧醫療產業的優勢。相信若個資規範、各種資料使用有完整的定義與管制後,將能帶動各項研究更快速、促進台灣智慧醫療照護產業的蓬勃發展。

推薦閱讀:

 

 

 

相關文章:

人工智慧把關用藥安全!AI 藥櫃取藥、送藥、用藥更精準

【AI在瘟疫蔓延時】台灣 AI「雅婷」化身音樂家 發表首張專輯「武漢肺炎」

【AI在瘟疫蔓延時】AI 大神吳恩達公司最新技術 用AI自動檢測社交距離

你是我的眼!Google AI 眼鏡助視障朋友「看見」世界

人工智慧改寫哈利波特續集,暗黑劇情大受好評!

這個國家即將任用人工智慧法官,它真能公正判決嗎(上)

超狂人工智慧專家巴克西,全球最年輕!!

全球首屆元宇宙時裝周,複刻20年前的失敗?

全球首屆元宇宙時裝周, 遇到瓶頸 複刻20年前的失敗? 目錄 元宇宙時裝周參與盛況 叫好不叫座?新興技術的行銷瓶頸 由虛擬實境平台 Decentraland 所舉辦的「元宇宙時裝週」(Metaverse Fashion Week...