
立法會前年同內地科企「科大訊飛」合作,開發「智識聽」AI謄錄系統謄寫會議紀錄,讓立法會及委員會會議的逐字紀錄工作走向智能化。立法會主席梁君彥及立法會秘書處秘書長衛碧瑤今日(2日)向傳媒介紹會議實時字幕服務。梁君彥表示,系統將提升字幕處理能力,加上2名實時編校員即場更正錯誤,形容「人機合一」,謄錄準確率將由93%提升至96%,期望日後會有99.9%的準確率。衛碧瑤表示,有關服務將會在7月內推出。
CPU轉GPU提速 字幕準確率達96%
梁君彥表示,系統的硬件由CPU(中央處理器) 升級為GPU(圖形處理器),提升字幕處理能力,加上2名實時編校員即場更正錯誤,形容「人機合一」,謄錄準確率將由93%提升至96%,期望日後會有99.9%的準確率,直言「好處就是令到香港市民更容易跟到立法會做緊啲咩,秘書處同事可以做一啲更高級的工作。」

梁君彥表示,系統的硬件由CPU(中央處理器) 升級為GPU(圖形處理器),提升字幕處理能力。黃子龍攝

實時字幕服務較現場直播延遲18至19秒,並自動生成後製字幕,基本上沒有任何太大的錯。黃子龍攝

梁君彥表示,系統以外有2名實時編校員即場更正錯誤,謄錄準確率將由93%提升至96%。黃子龍攝

立法會向「科大訊飛」團隊提供2.5億個文字本、20萬個關鍵詞400小時的音頻讓系統學習,因此謄錄準確率才提升至96%。黃子龍攝

「智識聽」AI謄錄系統讓立法會及委員會會議的逐字紀錄工作走向智能化。資料圖片
系統克服非母語謄錄難題 生僻詞庫持續擴容
對於有部份立法會議員並非以廣東話為母語,會否擔心逐字紀錄因而有所錯誤。梁君彥表示,立法會向「科大訊飛」團隊提供2.5億個文字本、20萬個關鍵詞400小時的音頻讓系統學習,因此謄錄準確率才提升至96%,強調這是秘書處和「科大訊飛」團隊合作成果,稱「相信難不倒我們這個系統。」
記者在現場觀察,實時字幕服務較現場直播延遲18至19秒,並自動生成後製字幕,基本上沒有任何太大的錯誤,惟部分地方如「馬草壟」卻變為「馬草龍」。梁君彥表示,未來希望優化服務較現場直播延遲15秒,又指有些地名系統還未學習,未來會加強系統學習能力。
記者:黃子龍