在第一年計畫期間(112/5/1~113/4/30),團隊成功開發出「太魯閣語協作平台」,這個平台有三大優勢:
- 支援多人同步協作錄音:大大加快語音資料的蒐集速度。
- 操作更簡單:只要點幾下按鈕就能錄音,即使是不熟電腦的耆老,也能輕鬆自己操作。
- 錄音更方便:不用專程到錄音室,在家用電腦或手機就能錄音,節省時間與交通成本。
在太魯閣語的蒐錄上,我們感謝有20位太魯閣族的耆老與族人一起參與,共錄製了超過62,000筆語音,總時數約110小時。
到了第二年計畫(113/5/1~114/4/30),團隊將這個平台擴展到鄒語使用,開發出「鄒語協作平台」。這次有33位鄒族的耆老與族人參與錄音,累積了超過70,000筆語音資料,總時數達到約240小時。
透過這個多語群協作平台,團隊建置了臺灣甚至全球最大規模的太魯閣語及鄒語語音資料庫,比「族語E樂園」、「FormosanBank」多好幾倍,這些珍貴的語音不但能保存耆老最標準的發音,成為族語文化的重要資產,也能作為族語AI模型訓練的關鍵資料來源。
目前第二期計畫已進一步擴展到卑南語,提供卑南語四個方言(南王、知本、西群初鹿、建和)的協作平台,未來期待多語群族語協作平台也能擴展到臺灣其他族群,協助全台16族42個語言別進行語音蒐錄與保存,守護即將消失的珍貴族語。

