噶瑪蘭語是臺灣極度瀕危的原住民族語言之一,保存情況比多數族語更為嚴峻,截至114年6月原委會的統計,全臺噶瑪蘭族人口僅1,714人,其中能流利使用族語的族人不到百人,而隨著高齡耆老逐漸凋零,語言傳承的危機越來越迫切。臺灣目前尚未有針對噶瑪蘭語語料大量蒐錄保存的團隊與工作,考量計畫「以包容為導向」之核心精神與目標方向,團隊啟動噶瑪蘭語的語料蒐錄工作,透過科技工具與族人合作,將耆老的語音完整保存下來,並建置可用於AI研究與教學推廣的語料庫,不僅是噶瑪蘭語保存的實際行動,更是文化永續的重要工程。
為了讓計畫能順利展開,團隊從7月起多次前往拜會噶瑪蘭語推廣組織,並積極與耆老、主播與族語專家交流,在拜會過程中,團隊分享了過去兩年在太魯閣語與鄒語語料蒐錄的成果:包括如何透過協作平台快速建置族語語料庫、訓練多語群族語AI模型,並且成功應用於語音辨識、語音合成與族語–華語雙向翻譯等,這些成果讓耆老與專家們看見了AI技術能為語言保存帶來的可能性,也進一步增強了合作的信心。同時,團隊也於8月8日與9日參加噶瑪蘭族的豐年祭,不僅有機會認識更多耆老與專家,更能深入體驗噶瑪蘭文化,讓雙方後續合作中能建立更緊密的信任與理解基礎。並於9月27日參加語推組織舉辨的噶瑪蘭族共識會議,再次凝聚雙方的合作默契與向心力。
在多次的拜會交流過程中,噶瑪蘭語推組織與多位耆老特別指出,目前的噶瑪蘭語語料存在部分錯誤,若直接拿來使用,將可能誤導學習者,也會影響語料庫與AI模型的品質,為了避免這個問題,團隊與語推組織達成共識:先由語推組織聚集一群噶瑪蘭語專家與耆老,進行現存語料的逐句審查、修訂內容,確認語料的正確性後,再將修訂過的語料上架到「噶瑪蘭語協作平台」。此次合作的重點強調「共創」機制,團隊不是單方面收錄語料,而是邀請耆老、專家、語推組織一起參與,從語料修訂、語音錄製到後續應用推廣,都由族人共同把關,確保語料的正確性與文化適切性。


