張雅琳 @ 第11屆第1會期教育及文化委員會第7次全體委員會議

時間: 0
Start Time End Time Text
00:00:00,109 00:00:00,469 委員長安
00:00:20,673 00:00:41,412 副主委早安那就是上次我們在討論那個台達這個計畫的時候啊是有講到說我們現在正在開發這個所謂的學研版本啊然後它有非常多的不錯的一些功能哦那但是我也發現這個計畫中有一個很有趣的部分也是我自己長期關注的所謂的母語教育的部分好那就是說現在國科會是在建構中
00:00:42,153 00:00:42,693 主席主席
00:01:01,946 00:01:20,321 我知道目前使用的資料庫就有臺灣隨俠資料集還有臺華臺平行語料庫、客委會語音資料庫、客語能力認證資料庫但是我看就是說我們公布在網站訓練資料幾乎都是整體中文的版本那這樣子的訓練資料量是足夠的嗎?
00:01:22,132 00:01:49,586 我想這部分當然就是如同委員這個上面寫的這個課與這個部分當然有特殊的這個資料庫我們要繼續爭取那目前我們盡量把已經我們可以授權的部分這個資料庫先放進去而且台德本身的他的這個資料庫很重要他就是希望建立政體本身就反理制本身在這個資料庫本身因為所有的資料庫背後都有社會文化的這個關係嘛所以這個是我們建立台德的部分非常重要的一個部分
00:01:50,486 00:01:51,189 具體來講夠不夠是不是可以簡單回答
00:01:55,001 00:02:19,559 跟委員報告我想您說的沒錯資料的訓練其實資料量就是最重要的那我們第一步開始當然是先衝正體中文那包含那個台語、客語以及這個原住民母語的部分也有都在思考可是的確那個語料從哪裡來像比如說我們就會找課委會說或是你們是不是有一些那個語言認證那個就是那就會拉進來
00:02:20,680 00:02:44,840 那我們未來還會有更多的訓練資料庫嗎?因為像文化部這幾年也產出了非常多的相關的課委會、委員會都有相關的一些教材那這些東西是不是都可以盡快的把它納進來?這個團隊都有很努力在跟各部會的資料的協商但它背後有一些智慧財產、著作權的問題需要解決那這個大概預計是有沒有一個行程的規劃嗎?
00:02:46,560 00:02:50,321 新的案子是什麼?是我們現在還沒有規劃?是未來在規劃的意思嗎?有規劃
00:03:08,005 00:03:11,107 國科會科技大官員網站資料,我是可以用台語詢問GPT關於科學的知識,然後會獲得台語的回答嗎?
00:03:25,759 00:03:44,821 對﹖
00:03:45,061 00:03:48,946 在台南大學就有將台語的模型出版導入了這個台語對話的生成師AI在人的國小做台語教學
00:04:02,283 00:04:15,904 目前是希望把機器人的對話能力提升到國中、中高中來幫助學生學台語我們現在相關的像客語或其他國家語言也是有這個方向讓他可以成為來幫助學生學台語的嗎?
00:04:20,124 00:04:33,173 這也是有一些相關期程已經出來了嗎?目前還沒有我想有很多的應用如果說把這個平台建立起來這個能力建立起來因為我們是建立核心的引擎那輸入
00:04:34,033 00:04:35,914 對,因為我們之前要講母語教學,只有一台,太少了吧?
00:05:03,214 00:05:23,968 網站上也可以透過,因為這個牽扯到AI的硬體進入學校還要跟教育部連結能不能把這個技術引進到他們常規性的教學工具跟輔助這個當然是一個大方向來講是希望成功建立這個技術以後能夠應用在其他各個部會的面向
00:05:24,949 00:05:41,831 好,那這個部分的話我們就來看看之後我們怎麼跟教育部討論好不好,就未來的部分啦。那就是說,因為我覺得這件事情真的非常重要,因為從這幾張圖表我們可以看到就是我們人,台灣的這個母語,台灣人的母語的能力是迅速的流失。
00:05:42,752 00:06:04,893 所以為什麼我會一直不停地強調我們的母語CHAT GPT可不可以有更多的語言來去支持不管是學校裡在教學也好或者是說有沒有可能在生活裡面也可以來協助因為像我自己33歲開始學台語嘛如果當時有這東西其實對我來說也是非常有幫助啦所以我想要知道就是說我們目前啊這個的CHAT GPT這個台德的GPT抱歉
00:06:05,914 00:06:20,667 我們目標是希望可以提升到他的等級到什麼樣子的等級因為剛是說中高級的國小師資的能力國小中高年級生的對話能力我們有沒有可能把它提升到可以做台語師資的能力呢
00:06:23,414 00:06:37,190 這個要仔細評估這個都是一個很大的方向但是要做到這一點可能怎麼樣的資源跟各方面但是可以做基本的這些溝通本身應該是最基本的目標啦因為這個也是目前我們已經大概初步的成果那有這個成果以後我們應該是往下進進
00:06:40,313 00:06:40,553 金準運科
00:06:56,480 00:07:19,222 107年有一個精準運動科學的研究專案計畫因為當時奧運結束不久所以大家都非常關注這件事情那當時國科會也編列了一個4年的2.4億的研究計畫所以讓我們現在在看棒球的時候我們可以知道說那個球現在投到哪一個位置所以是非常的有趣然後也提供了學校做這個智能羽球訓練那據我所知
00:07:20,823 00:07:46,688 這個訓練目前好像是已經結束了然後也導入了商業化的使用我現在收到的資訊是這樣現在是商業化的使用但是我希望運科不僅只是要精準還需要到普及所以這樣子的計畫是不是可以落實到更多的基層訓練讓更多的國中小的青少年選手運動員可以來做到這樣子的一個這樣子的科學訓練這可不可行
00:07:50,482 00:08:06,508 我想跨部會這要透過跨部會的落地核心的技術這邊發展出來用這個第一期的運科計畫已經出來而且確實有幫助在某些關鍵的這個運動本身的這個幫忙所以如何變成可能要跟我們要其他各個部會要一起來
00:08:07,549 00:08:10,732 在12個第二期的計畫,像是羽球、體操等,我們可以先找一些學校來一起做這些?
00:08:24,639 00:08:51,775 合作呢?就像新豐高中這樣子的案例是不是可以找更多的中小學一起來合作呢?報告委員因為二期運課的一個目的真的就是委員所講的要從運動的專業訓練導向全民那其實我們這邊的科研都要用實驗的概念在進行所以第一階段在科研的部分都是以特定的學校然後取得默契之後進行實驗可行安全之後才會做推廣所以推廣應該是下一期的工作這個一定會做
00:08:52,495 00:09:15,475 是第三期嗎?說明還會有第三期嗎?你指的下一期是第三期就對了?我不能保證,但是我很期待有第三期對,因為這個部分我們是不是可以來思考把它規劃第三期因為你現在那個體育署的計畫他們雖然是有這個運科中心在做可是這個效率實在是目前來說每年一千個我們總共現在已經有三萬五千個體育班的學生所以我還是非常希望說
00:09:16,135 00:09:31,633 我們可以來跟體育署這邊一起來討論讓這個運動也要普及讓更多的小孩可以去用一個比較安全而且比較科學化的訓練不要在養成的過程之中就先受傷這部分我們是不是可以來跟體育署一起討論
00:09:32,874 00:09:56,993 本來就是會跟體育署一起討論那也跟委員報告就是因為我們在做實驗的階段裡面一定要保證它的安全性所以像羽球羽球是用監測器來測量說它到底能不能有效的增進它的一個效率那所以呢在實驗階段裡面其實是特定學校那等到下一期之後就會等到安全商業化之後其實就真的可以普及因為一定要讓它成本降低才有辦法普及
00:09:57,173 00:09:59,856 大學老師在做實驗所以他有特定的實驗室然後在以及到了實驗室以外會有特定的學校
00:10:15,225 00:10:15,625 主持人 張雅琳
00:10:33,857 00:10:35,799 提招主要是以次大的唐家宏選手做實驗對象
00:10:52,279 00:10:55,080 商業化對於一般小學或中學來說是不具備資源或資金去做所以我們還是要去思考如何提供公益使用
00:11:07,981 00:11:08,081 謝謝張雅琳
公報發言紀錄

發言片段

lineno: 704

發言片段: 0
張委員雅琳:(10時49分)謝謝主席,有請我們的副主委,謝謝。
發言片段: 1
主席:好,有請林副主委。
發言片段: 2
林副主任委員敏聰:委員早安。
發言片段: 3
張委員雅琳:副主委早安。上次我們在討論TAIDE這個計畫的時候,是有講到我們現在正在開發所謂的學研版本,它有非常多不錯的功能,但是我也發現這個計畫中有一個很有趣的部分,也是我自己長期關注的所謂母語教育的部分。就是現在國科會是在建構正體中文的版本,同時也有在使用基於13B的學研版本來訓練臺語與客語的ChatGPT,希望未來可以應用在中小學的母語教育,來協助推廣母語教育。因為在訓練這種語言模型的時候,最重要的就是資料庫,我知道目前使用的資料庫就有台灣媠聲資料集,還有臺華台平行語料庫、客委會語音資料庫、客語能力認證資料庫,但是我看了我們公布在網站的訓練資料,幾乎都是正體中文的版本,這樣子的訓練資料量是足夠的嗎?
發言片段: 4
林副主任委員敏聰:我想這個部分當然就是如同委員上面寫的,客語這個部分當然有特殊的資料庫,我們會積極去爭取,目前我們是儘量把已經可以授權的資料庫先放進去,而且TAIDE本身的資料庫很重要,它就是希望建立正體字本身,就繁體字本身這個資料庫,因為所有資料庫的背後都有社會文化的關係,所以這個是我們建立TAIDE非常重要的一個部分,具體來講夠不夠,請副執行秘書簡單回答。
發言片段: 5
林副執行秘書明仁:跟委員報告,我想您說的沒錯,資料的訓練其實資料量就是最重要的,我們第一步開始當然是先充正體中文,包含臺語、客語、原住民母語的部分也都有在思考,可是的確那個語料從哪裡來,比如我們就會找客委會,問他們是不是有一些語言認證,那個就是,就會拉進來……
發言片段: 6
張委員雅琳:我們未來還會有更多的訓練資料庫嗎?因為像文化部這幾年也產出非常多相關的……
發言片段: 7
林副執行秘書明仁:會、會。
發言片段: 8
張委員雅琳:客委會、原委會都有相關的一些教材,這些東西是不是都可以儘快地納進來,一起來做……
發言片段: 9
林副執行秘書明仁:是,這個團隊都有很努力在跟各部會就資料協商,但它背後有著作權的問題需要解決。
發言片段: 10
張委員雅琳:對,針對這件事情,你們有一個期程的規劃嗎?
發言片段: 11
林副執行秘書明仁:我們第一期是4月底7B會先釋出,那案子就……
發言片段: 12
張委員雅琳:我知道,但是我是針對於母語訓練的部分。
發言片段: 13
林副執行秘書明仁:如果有新的案子的話,我們就會再繼續找母語,繼續再加強這方面的訓練。
發言片段: 14
張委員雅琳:新的案子指的意思是什麼?是我們現在還沒有規劃,是未來再規劃的意思嗎?
發言片段: 15
林副執行秘書明仁:有規劃了。
發言片段: 16
張委員雅琳:有規劃。
發言片段: 17
林副主任委員敏聰:這個會持續。
發言片段: 18
林副執行秘書明仁:這個一定會持續。
發言片段: 19
張委員雅琳:這個會持續,好,那有沒有一些相關的資料,就如果你現在已經有些規劃期程的話,是不是也可以提供到我們辦公室,好不好?
發言片段: 20
林副執行秘書明仁:好,沒有問題。
發言片段: 21
張委員雅琳:謝謝。
再來,在這個訓練的資料裡面,像是國科會「科技大觀園」網站的資料,我是可以用臺語詢問ChatGPT關於科學的知識,會獲得臺語的回答嗎?
發言片段: 22
林副主任委員敏聰:我們希望有一天可以用不同的語言來回答,但目前可能還沒有,這是一個很好的提議……
發言片段: 23
張委員雅琳:那我們可不可以往這個方向,好不好?
發言片段: 24
林副主任委員敏聰:對、對、對……
發言片段: 25
張委員雅琳:不然,你已經做了這個……
發言片段: 26
林副主任委員敏聰:就真的用不同語言輸入,然後它就可以回答,這個應該是要。
發言片段: 27
張委員雅琳:好不好?我們往這個方向,因為你也都把一些語言認證的東西放進去了,我們往這個方向來努力……
發言片段: 28
林副主任委員敏聰:對,這樣會很有感。
發言片段: 29
張委員雅琳:對。再來,之前也有講到臺語版正在導入中小學臺語教學的應用案例,在臺南大學就有將臺語的這個模型出版,導入臺語對話的生成式AI,在仁德國小做臺語教學,我想要知道,目前是希望可以把這個機器人的對話能力提升到國小中高年級,來幫助學生學臺語,那我們現在相關的像客語或其他國家語言也是有這個方向,讓它可以成為幫助學生學臺語的嗎?這個也是有嗎?
發言片段: 30
林副執行秘書明仁:這個後面我們就持續規劃。
發言片段: 31
張委員雅琳:這個也是有一些相關的規劃期程已經出來了嗎?
發言片段: 32
林副執行秘書明仁:目前還沒有。
發言片段: 33
張委員雅琳:目前還沒有。
發言片段: 34
林副主任委員敏聰:目前還沒有,我想有很多的應用,如果把這個平台建立起來,這個能力建立起來,因為我們是建立核心的引擎,輸入重要的資料,如果這個起來以後……
發言片段: 35
張委員雅琳:我懂,但是因為13B已經開始做這個部分了嘛!
發言片段: 36
林副主任委員敏聰:對,我們就可以跟其他的應用面連結,它就可以應用這個資料庫來做剛剛委員提供的這些很多很多的應用面。
發言片段: 37
張委員雅琳:好,我想問一下,這台AI機器人有沒有辦法導入更多學校?
發言片段: 38
林副主任委員敏聰:這台機器人……
發言片段: 39
張委員雅琳:因為目前只有一個學校,未來有可能……
發言片段: 40
林副主任委員敏聰:我覺得這是一個方向,如果未來……
發言片段: 41
張委員雅琳:對,因為我們既然講要母語教學,只有一台,太少了吧!
發言片段: 42
林副主任委員敏聰:也可以透過網站,就有很多東西是透過網站或者其他部分,因為這個牽扯到AI的硬體,進入學校,這個還要跟教育部什麼之類的要連結,看能不能把這個技術引進到他們常規性的教學工具及輔助,當然大方向來講,希望成功建立這個技術以後,能夠應用在其他各個部會的面向。
發言片段: 43
張委員雅琳:好,這個部分的話,我們就來看看之後我們怎麼跟教育部討論,好不好?就未來的部分。
我覺得這件事情真的非常重要,因為從這幾張圖表,我們可以看到我們臺灣人的母語能力是迅速地流失,所以為什麼我會一直不停地強調我們的母語ChatGPT可不可以有更多的語言來支持,不管是學校裡的教學也好,或者是有沒有可能在生活裡面也可以來協助,像我自己33歲開始學臺語,如果當時有這個東西,其實對我來說也是非常有幫助,所以我想要知道目前TAIDE的GPT目標是希望可以提升它的等級到什麼樣子的等級,剛剛是說國小中高年級生的對話能力,我們有沒有可能把它提升到可以做臺語師資的能力呢?
發言片段: 44
林副主任委員敏聰:這個要仔細評估,這個是一個很大的方向……
發言片段: 45
張委員雅琳:這可不可以做一些評估,好不好?
發言片段: 46
林副主任委員敏聰:要做到這一點,可能要怎麼樣的資源及各方面,但是可以做基本的溝通本身應該是最基本的目標,這個也是目前我們大概的初步成果,有這個成果以後,我們應該是往下精進。
發言片段: 47
張委員雅琳:好,我也是拜託副主委幫我們想辦法,就是除了臺語可以有基本的對話能力,其他的國家語言也都要有,好不好?
發言片段: 48
林副主任委員敏聰:是、是,好。
發言片段: 49
張委員雅琳:好不好?大概是什麼時候可以做到,我們就會後討論,好不好?
再來,精準運科的部分,其實在107年的時候,我們有一個精準運動科學的研究專案計畫,當時就是奧運結束不久,大家都非常關注這件事情,當時國科會也編列了一個四年2.4億的研究計畫,所以讓我們現在在看棒球的時候,我們可以知道那個球現在投到哪一個位置,非常地有趣,也提供學校做智能羽球訓練,據我所知,這個訓練目前好像是已經結束了,也導入了商業化的使用,我現在收到的資訊是這樣,現在是商業化的使用,但是我希望運科不僅是要精準,還需要到普及,所以這樣子的計畫是不是可以落實到更多的基層訓練,讓更多的國中小青少年選手、運動員可以來做這樣子的科學訓練,這可不可行?
發言片段: 50
林副主任委員敏聰:我想這個要透過跨部會的落地……
發言片段: 51
張委員雅琳:對。
發言片段: 52
林副主任委員敏聰:就核心的技術這邊發展出來,第一期的運科計畫已經出來,而且確實在某些關鍵的運動本身有幫助,所以如何……
發言片段: 53
張委員雅琳:沒錯,但是我們現在其實……
發言片段: 54
林副主任委員敏聰:可能我們和其他各個部會要一起來努力。
發言片段: 55
張委員雅琳:但是我們現在這十二個第二期計畫,像羽球,羽球的部分也是,還有像體操練習,因為體操其實是一個非常容易受到運動傷害的項目,這些東西是不是我們可以先找一些學校一起來做這些合作呢?就像新豐高中這樣子的案例,是不是可以找更多的中小學一起來合作呢?
發言片段: 56
蘇處長碩斌:報告委員,因為二期運科的一個目的真的就是委員所講的,要從運動的專業訓練導向全民,其實我們這邊的科研都要用實驗的概念在進行,所以第一階段在科研的部分都是以特定的學校,取得默契之後,進行實驗,可行、安全之後,才會做推廣,所以推廣應該是下一期的工作,這個一定會做。
發言片段: 57
張委員雅琳:是第三期嗎?所以我們還會有第三期,你指的下一期是第三期就對了?
發言片段: 58
蘇處長碩斌:我不能保證,但是我很期待有第三期。
發言片段: 59
張委員雅琳:對,這個部分我們是不是可以來思考規劃第三期?因為現在體育署的計畫雖然是有運科中心在做,可是效率實在是,目前來說每年1,000個,但我們現在總共已經有3萬5,000個體育班的學生,所以我還是非常希望我們可以跟體育署一起來討論,讓這個運科也要普及,讓更多的小孩可以去用比較安全而且比較科學化的訓練,不要在養成的過程之中就先受傷,這個部分我們是不是可以來跟體育署一起討論呢?
發言片段: 60
蘇處長碩斌:這一定的,本來就是會跟體育署一起討論,也跟委員報告,因為我們在做實驗的階段裡面一定要保證其安全性,像羽球,羽球是用感測器來測量到底能不能有效地增進效率,所以在實驗階段裡面其實是特定學校,等到下一期之後就會……
發言片段: 61
張委員雅琳:所以現在這十二個案子都是已經找好特定學校了,是嗎?
發言片段: 62
蘇處長碩斌:等到安全、商業化之後,其實就真的可以普及,因為一定要讓它成本降低,才有辦法普及。
發言片段: 63
張委員雅琳:對、對、對,我知道,抱歉,我再耽誤1分鐘的時間,就是我們現在這十二個案子裡面都已經找好學校了,是不是?
發言片段: 64
蘇處長碩斌:對、對、對……
發言片段: 65
張委員雅琳:都已經找好了……
發言片段: 66
蘇處長碩斌:因為是大學老師在做實驗,所以他有特定的實驗室,以及到實驗室以外會有特定的學校。
發言片段: 67
張委員雅琳:這些學校都是什麼樣子?是……
發言片段: 68
蘇處長碩斌:大概都跟地緣有關係……
發言片段: 69
張委員雅琳:跟地緣有關係。
發言片段: 70
蘇處長碩斌:清大就會找新竹的學校,成大就會找臺南附近的學校。
發言片段: 71
張委員雅琳:好,那我希望各自詳細的學校,我們是不是可以知道它是屬於高中、國中,還是都是大學,因為這還是有差啦!基層訓練……
發言片段: 72
蘇處長碩斌:國中、高中居多。
發言片段: 73
張委員雅琳:國中、高中為主,是不是?
發言片段: 74
蘇處長碩斌:如果是專業訓練員,那就是成人。
發言片段: 75
張委員雅琳:都是大學生?
發言片段: 76
蘇處長碩斌:像拳擊,大概就不會有國小。
發言片段: 77
張委員雅琳:沒錯、沒錯,有一些項目,像體操,應該是比較小就要開始,所以我想知道相關的……
發言片段: 78
蘇處長碩斌:體操,對,但因為我們這邊是在做監測,所以體操主要是以師大的唐嘉鴻選手為實驗對象。
發言片段: 79
張委員雅琳:好,瞭解。因為剛才有提到商業化使用,但是我覺得商業化對一般小學、中學來說,其實可能不太具備這樣的資源跟資金去做,所以我們可能還是要思考如何提供公益使用的部分,好不好?
發言片段: 80
蘇處長碩斌:其實那個……
發言片段: 81
張委員雅琳:還是目前已經有了?
發言片段: 82
蘇處長碩斌:羽球是在做智慧球場,球場的建置完成之後,可以省掉非常多的教練成本,這個以後一定會往各個學校去推廣,他們會接受的。
發言片段: 83
張委員雅琳:目前我們已經有這樣的推廣計畫,還是還沒有?
發言片段: 84
蘇處長碩斌:目前還沒建置完成,因為還要測試。
發言片段: 85
張委員雅琳:好,瞭解,謝謝。
發言片段: 86
主席:好,謝謝張雅琳委員,林副請回座。
現在休息5分鐘,謝謝。
休息(11時1分)
繼續開會(11時6分)
發言片段: 87
主席:好,現在繼續開會。
接下來請吳春城委員質詢。

公報詮釋資料

page_end 386
meet_id 委員會-11-1-22-7
speakers ["林宜瑾","洪孟楷","柯志恩","吳沛憶","羅廷瑋","陳培瑜","葛如鈞","郭昱晴","葉元之","陳秀寳","張雅琳","吳春城","萬美玲","范雲","鄭天財Sra Kacaw","牛煦庭","鍾佳濱","楊瓊瓔","林倩綺","陳冠廷","邱志偉"]
page_start 321
meetingDate ["2024-04-11"]
gazette_id 1132701
agenda_lcidc_ids ["1132701_00006"]
meet_name 立法院第11屆第1會期教育及文化委員會第7次全體委員會議紀錄
content 邀請國家科學及技術委員會列席就「國家科技發展策略與布局」進行專題報告,並備質詢
agenda_id 1132701_00005