公報發言紀錄

發言片段

lineno: 332

發言片段: 0
吳委員思瑤:(10時18分)好,謝謝主席,有請主委。
發言片段: 1
主席:請主委。
發言片段: 2
吳主任委員政忠:吳委員早。
發言片段: 3
吳委員思瑤:主委早,國科會的同仁大家辛苦了,時間有限,我就直接講重點。我今天為您聚焦在拼AI,臺灣要贏,要打造AI發展國家隊,我們準備的怎麼樣了呢?確實各國都拼AI,臺灣不只不能輸,我們要贏,我們有非常好的科研基礎。我看到我們在8大科研平臺,113年度針對AI的投入編列了40億,可是相較於國際,英國10億歐元,是臺灣的9.5倍,美國33億美元,是臺灣的10倍,德國10億歐元,臺灣一樣輸了九點多倍,日本投入1,640億日圓,臺灣的預算規模也落後他們,輸了將近9倍。即便我們在8大科研平臺裡頭把AI放進來……。我也要肯定重啟的科技顧問制度即將開會,首輪的會議你們聚焦在半導體、AI及淨零科技,AI已經成為你看到眼前必須發展的項目,也是長遠布建的關鍵,但是我們這樣的資源真的不夠。
剛剛講預算,現在來講法制。AI的發展不是一年大一吋,是一年大幾百吋,臺灣在監控管理的制度畢竟需要有完備的法規,才能夠讓AI相關產業鏈的權益能夠被保護,從開發者、資料的主體、資料的作者、著作權人,包括消費端,所以歐盟已經開始研議了AI發展的基本法,那您認為臺灣需不需要開始來研究、推動臺灣的AI基本法,才能夠匡列必要且充分的預算,投入相關的資源以及擘建國家級的平台?我們需要一部AI發展的基本法,您認為呢?主委。
發言片段: 4
吳主任委員政忠:那一定是需要的,但是那個時間點必須要拿捏。
發言片段: 5
吳委員思瑤:是,您覺得什麼時間點?還需要多久?
發言片段: 6
吳主任委員政忠:目前就是先指引,你看看美國只發行政命令。
發言片段: 7
吳委員思瑤:對,美國是用行政命令,沒錯。
發言片段: 8
吳主任委員政忠:尤其是生成式的人工智慧跟原來的人工智慧差非常非常多,很多相關的法令都必須要revise。所以我想大家都在看,包括英國也是,歐盟事實上也還沒有到最後一關。
發言片段: 9
吳委員思瑤:現在是草案,還在匯聚歐盟成員共同的意見。
發言片段: 10
吳主任委員政忠:所以我們會密切關注,事實上我們整個人工智慧基本法案一些必須要的已經都有考慮進來了。
發言片段: 11
吳委員思瑤:好,我非常同意,誠如主委剛剛所說的,我也觀察到歐盟討論很久但目前還在草案階段,然後美國投入這麼多,但他們先用行政法規來進行。我認為如您所說我們在觀察,因為相關的技術還在發展,然後相關的法規面也參酌國際的軌跡跟經驗,如果能夠催生臺灣的AI發展基本法,時機到了,我們就需要有具足的準備,好嗎?我期待我們的國科會團隊、跨部會的團隊往這方面來努力。
AI要贏當然就要贏在data,之前中研院發生的不當引用簡體中文資料庫衍生的爭議,都已經做出檢討的方案,除了短期要強化使用者引用的風險管控之外,長程就是要建構臺灣自己的ChatGPT,臺版的繁中語言資料庫,對內讓我們自己的研究同仁、國人引用正確、可信、合適、合宜的內容,另外對外才讓世界有正確的臺灣價值、正確的民主觀點資料可以被引用,所以建構臺版的資料庫是刻不容緩的。
我們在做了,TAIDE由國科會、數發部、中研院開始要自製臺灣的大型語言模型,3億而已,夠嗎?主委。
發言片段: 12
吳主任委員政忠:目前是夠,事實上最主要就是超級電腦,那我們超級電腦已經在那邊,我們加了一些GPU進去。
發言片段: 13
吳委員思瑤:所以這3億是技術層面、演算層面的投入?
發言片段: 14
吳主任委員政忠:一半是硬體,另外一半就是資料的取得。
發言片段: 15
吳委員思瑤:我很少聽到官員審預算的時候在台上跟我說預算夠了,我本來想說要再多一點。好,沒關係,花3億就用得好、用得準、用得正確。但是這3億除了在硬件之外,其實很重要的就是軟體,對不對?要蒐集這些文本的資料庫。
發言片段: 16
吳主任委員政忠:是的。
發言片段: 17
吳委員思瑤:所以我也去問了ChatGPT,建構一個優質的自然語言模型,到底要有哪些關鍵因素?它真的回答得超專業的,它說要有大量的訓練資料、深度學習架構、大規模運算資源、有效的訓練算法、定期更新改進、品質評估及反饋,每一點都對欸!那我進一步問它,這六項因素最重要的是哪一項?它說大量的訓練資料是最基本也是最關鍵的因素,這是ChatGPT說的,那我想就教於Chat吳政忠,您覺得臺版的大型語言資料庫什麼最重要?
發言片段: 18
吳主任委員政忠:當然大量的訓練資料是基礎,沒有資料它就沒有用,但是最後第六個品質的評估跟反饋,大家的一個概念就是你把它弄出來以後……
發言片段: 19
吳委員思瑤:哎呀!太好了,謝謝主委,幸好你的回答讓我確認人的智慧還是優於機器啊!確實您回答的就是關鍵中的關鍵,品質的管控跟回饋大於訓練資料庫的重要性。感謝Chat吳政忠贏過ChatGPT。
發言片段: 20
吳主任委員政忠:所以我們那個TAIDE的第一時間,數位部就有一個安全檢測中心。
發言片段: 21
吳委員思瑤:對,這是一個重點,但是我要跟您討論的另一個面向,我關切的點是訓練資料當中我們需要蒐集最多元的臺灣觀點,而且我們相信臺灣觀點是正確的觀點,是世界需要的普世價值,目前TAIDE裡面所用的這套推動可信任生成式AI發展先行計畫中,你們引用的資料就是教育部的字典、辭典、中央政府機關常見問題,還有以國科會為主的科技大觀園、科學發展月刊等等,我認為第一個數量還是少,第二個領域偏重科技,不夠多元,所以我要具體提供我的建議。如果從公部門來下手蒐集好的資料、可信任的資料、具備臺灣正確觀點的資料,就以教科文單位來講,文化部出版了非常多的權威期刊,就連教育部體育署的體育專刊、臺灣經濟部門各類的經濟專刊都可以納入你們的資料庫,我覺得是沒有問題的,這是我的提醒。進一步,我作為一個長期關切文化議題的人,無論如何要分享這個訊息給國科會的團隊、數發部的團隊和中研院的團隊,TAIDE一定要引用前瞻建設中的國家文化記憶庫,目前已經蒐集了309萬筆資料,而這個文化部主打的國家文化記憶庫,是由地方政府、民間參與、跨部會及部屬博物館,由下而上、由上而下共同書寫出來的臺灣文化記憶,所以這個一定要納入成為TAIDE的資料文本,非常重要,本席提醒你們目前還沒有。
發言片段: 22
吳主任委員政忠:跟委員報告,事實上已經授權我們在處理當中,已經給我們的有政府各部會的一些判決或資料庫,各地方的觀光局也有,已經授權的,包括文化部和各個部會,我們持續來跟政府部會溝通。
發言片段: 23
吳委員思瑤:因為時間有限,我就停在這一頁,這是經濟學人的報導,data就是新石油new oil,我們必須布建這樣很充分的資料文本,才能夠對內讓國人正確的引用,對外不會受制於中國爭奪資料的話語權。我剛剛說我們的TAIDE系統3億元,我認為需要更多的布建,而內容的領域多元、內容由下而上、由上而下的資料提供,都需要跨部會協力。剛剛如您所說的,本席拋出的文化部國家文化記憶庫從1.0到2.0,資料非常的多元,也非常開心聽到主委說的,看來我們已經正在建構跨部會資料提供的工作。我非常期待TAIDE能夠趕快建置完成,讓臺灣的生成式AI的資料引用可以成為世界的王道,好嗎?加油!
發言片段: 24
吳主任委員政忠:可以,謝謝。
發言片段: 25
主席(陳委員秀寳代):謝謝吳思瑤委員質詢,主委請回座。
接下來請鄭麗文召委質詢。

公報詮釋資料

page_end 422
meet_id 委員會-10-8-22-7
speakers ["鄭麗文","范雲","鄭正鈐","張廖萬堅","陳培瑜","張其祿","萬美玲","吳思瑤","陳秀寳","林宜瑾","陳靜敏","黃國書","鍾佳濱"]
page_start 387
meetingDate ["2023-11-08"]
gazette_id 1128303
agenda_lcidc_ids ["1128303_00004"]
meet_name 立法院第10屆第8會期教育及文化委員會第7次全體委員會議紀錄
content 一、審查113年度中央政府總預算案有關國家科學及技術委員會及所屬單位預算案;二、審查113 年度中央政府總預算案有關行政院主管行政院國家科學技術發展基金附屬單位預算案;三、審查 113年度中央政府總預算案有關國家科學及技術委員會主管科學園區管理局作業基金附屬單位預 算案;四、審查113年度行政法人國家災害防救科技中心預算案;五、審查 112年度及113年度行 政法人國家太空中心預算案;六、審查 112年度中央政府總預算有關國家科學及技術委員會主管 預算(非營業基金預算)解凍案2案(第一案至第五案僅進行詢答)
agenda_id 1128303_00002