主講人
廖元甫教授 國立陽明交通大學 智能所
Liāu Guân-hú kàu-siū kok-li̍p Iông-bîng Kau-thong Tāi-ha̍k Tì-lîng-sóo
教育部台語文語料庫收集計畫的時間是對2022年到2027年,計畫的主要目的,包含:
1. 建置國家語言語料庫,收錄3000萬台文文字,實際反映當代台語文使用狀況。
2. 發展台語文自動化處理的AI工具,EX:台語語音辨認,台語語音合成,華台翻譯佮台文自然語言分析等,嘛歡迎逐家參考阮的網站資料:
Speech Communication Lab. – Demo (google.com)
針對完善台語文語料的收錄工課,實際上阮猶閣咧討論按怎做才是上好的做法,所以非常需要佮逐家討論。尤其是來源佮授權的問題。若是各位先進有任何的想法、問題,攏歡迎逐家來佮阮聯絡做伙討論。
Kàu-io̍k-pōo tâi-gí-bûn gí-liāu-khòo siu-tsi̍p kè-uē ê sî-kan sī uì 2022 nî kàu 2027 nî, kè-uē ê tsú-iàu bo̍k-ti̍k, pau-hâm:
1. Kiàn-tì kok-ka gí-giân gí-liāu-khòo, siu-lo̍k 3000 bān tâi-bûn bûn-jī, si̍t-tsè huán-ìng tong-tāi tâi-gí-bûn sú-iōng tsōng-hóng.
2. Huat-tián tâi-gí-bûn tsū-tōng-huà tshú-lí ê AI kang-kū, EX:tâi-gí gí-im piān-jīm, tâi-gí gí-im ha̍p-sîng, huâ tâi huan-i̍k kap tâi-bûn tsū-jiân gí-giân hun-sik tíng, mā huan-gîng ta̍k-ke tsham-khó guán ê bang-tsām tsu-liāu: Speech Communication Lab. – Demo (google.com)
Tsiam-tuì uân-siān tâi-gí-bûn gí-liāu ê siu-lo̍k khang-khuè, si̍t-tsè-siōng guán iáu-koh teh thó-lūn án-tsuánn tsò tsiah-sī siōng-hó ê tsò-huat, sóo-í hui-siông su-iàu kap ta̍k-ke thó-lūn. Iû-kî sī lâi-guân kap siū-khuân ê būn-tê. Nā-sī kok-uī sian-tsìn ū jīm-hô ê siūnn-huat, būn-tê, lóng huan-gîng ta̍k-ke lâi kap guán liân-lo̍k tsò-hué thó-lūn.
聯絡窗口:
楊子彤 email:m31221123@gmail.com
白芯瑜 email: elmairy202624@gmail.com
時間
2022/08/27拜六
台灣暗時10點| 歐洲下晡4點| 加東早起10點| 美西早起7點
線頂聚會網址(meeting link):
https://natwa.webex.com/meet/taigi