跳到主要內容區塊
:::

台大AI中心(AINTU)|結合深度學習與機器學習 影像辨識應用廣泛超乎想像

人工智慧技術暨全幅健康照護聯合研究中心|徐宏民教授團隊

我們時常在電影中看到超越想像的黑科技,過去覺得遙不可及,如今卻隨著人工智慧、深度學習、機器學習、視覺演算法等關鍵技術日益精進,找到許多可以落地應用的新出路。

當電腦有了深度學習能力 能夠創造更多新興應用場域

曾是台灣知名影音技術公司CyberLink創始成員的徐宏民教授,為現任台大資工系教授及NVIDIA AI Lab計畫主持人,長期帶領研究團隊開發深度學習、機器學習、影像處理演算法等各種創新技術,即是希望尋找適合落地應用的新場域。他指著置放在櫃子上的杯子說起,「想讓機械手臂去取杯子,然後三個併排在一起,沒有詳細指令,電腦無法像人類一樣準確掌握拿取時的弧度、力道及方位。」但如果給予電腦足夠數據資料,學會偵測、識別、分析眼前影像訊息,就可望達成指定任務。

徐宏民教授再進一步以自己為例,提起2016年暑假到美國IBM華生研究中心進行休假研究,被指派與另一名研究員,啟動全球第一支使用人工智慧剪接電影預告片的計畫,為了讓電腦自行剪輯出電影《魔詭》六分鐘預告片,他讓電腦看過一百支恐怖片預告,學習電影中的各種恐怖元素,再透過深度學習模仿剪輯邏輯,進而組構出最終預告片內容,結果同年年底發表時,立刻引發全球關注,就連IBM執行長都不可置信這項計畫如此成功。

前瞻AI研究尋求產學合作 旨在協助人類解決各種問題

想讓電腦不再只能接受死板指令,可以模擬人類行為,排列杯子或剪輯預告片,關鍵在於提升推理邏輯與辨識能力,所以受到科技部支持,徐宏民教授帶領研究團隊開啟「DeepTutor:利用大規模多媒體資訊進行深度問答以及智慧導師」計畫,希望研發出最有效率、最安全又最方便的演算法,解決諸多傳統影像辨識難題,廣泛運用在治安、交通、醫療、國防、娛樂等多元場域。

「我們常做許多別人沒做過的前瞻AI研究,因為這些高風險的實驗,如果台大不做,誰又能來做呢!」對於經常鼓勵研究團隊參加比賽,從中找到研究價值、培養世界級企圖心的徐宏民教授來說,只要為夠幫助人類解決問題,非常願意貢獻一己之長,包括樂意公開研究數據,甚至進行產學合作推廣AI應用,像已和微軟一起運用影像辨識技術寫出詩集,和聯發科研究低解析度人臉影像辨識技術,也和台大醫院攜手提升癌症影像診斷辨識技能,努力將前瞻研究轉化為商業實證,並讓創新技術加速應用到產業界,提升台灣各產業的世界競爭力。

雖然隨著電腦有了更好的邏輯運算與辨識能力,不少人提出質疑:人的價值會不會被取代?但徐宏民教授語氣堅定地表示,大家最熟悉的好萊塢電影產業,可是運用了不少高科技技術,「但優秀導演和演員並沒有被取代,畢竟個性和想法都是無可取代的賣點」,所以投入AI前瞻技術研究,不是為了想取代人,反而希望人機合作,在追求更加便利的生活之際,拓展無限可能的未來。

▶原文連結

▶了解更多AI潛力新星

圖說:AI影像辨識可廣泛運用在治安、交通、醫療、國防、娛樂等多元場域