還在用人工聽打?讓您6小時快速學會AI聽打

「速學Python語音轉字檔Workshop」(課程優惠實施中)

在這AI爆炸的時代,似乎什麼都要來AI一下,不會AI技術好像就落後了一樣,但以現實狀況來說,對於不懂AI技術但又有商業或立即性需求的人來說,根本無從下手。好在Google在近年提供了AI雲端相關服務,讓對AI需求者可以透過Google API,套用深度學習工具,快速產出可交付成果。

這些深度學習的工具概括了:
  • 自然語言處理
  • 語音辨識
  • 影像處理
  • 及時語譯

等等…不勝枚舉的應用,有關更多資訊可以參考Google機器學習

而有鑑於我周遭朋友,如:記者、公關、研究生、演講者、聽打者與語音轉文字的需求者對逐字稿「聽打」的需求與日俱增,我們便深入研究AI聽打的可能性。經過數些時日的研究與編程,我們特地將Google聽打機器學習的複雜的流程優化成一組組的Python套件,讓我們能以簡單易懂、事半功倍的方法讓機器實行「AI語音轉文字」。

不僅如此,我們還發現實用該方法的幾項好處:


  1. Google平台有贈送價值$9,000元新台幣的語音轉字稿額度,讓我們可以輕鬆使用Google API的服務,換算下來,共約有200小時的免費額度,讓AI聽打使用無負擔,同時也省下不少成本!
  2. 共1個小時的錄音檔,只需要花費9分鐘就可以完成!(如果錄音取樣頻率為16KHz),就算是高音質錄音檔(取樣頻率48KHz),也僅要花大約25分鐘左右的時間就可以精確完成! 相較於人工處理的方式,要自己花 3小時批打 30 分鐘的逐字稿內容,這樣比較起來,AI聽打絕對是不錯的選擇!
  3. 使用Python,我們搞定了語音檔與逐字稿的對應分鐘數,這往往是我們是花我們要從錄音檔中一個個去聆聽才能知其內容的成本,用Python輕鬆搞定~!
  4. 將影片語音檔進行AI聽打,省力、省成本。許多公司或個人都會有影片上字幕的困擾,可以先使用AI聽打 + 對應分鐘數,節省聽打前製0–1人工打字幕的前置作業。
  5. 情感資源分析,讓公司或個人能透過網路評論或者語音檔,立即知道客戶情緒,或者進行週及月不同情緒上的關鍵字詞。
  6. 自動化字稿備份,讓解譯出來的文字稿能夠立即自動化上傳google雲端,做好備份保存。

深度學習工具,實踐AI聽打功能,部分Demo
更多內容,請歡迎參加我們的課程,學會更多!


AI聽打範例,雖然無法百分百正確,但至少節省了從0到1的人工聽打

AI聽打字詞正確矩陣,不但附上每個段落的時間,還附加改善順序,供人工聽打改善參考

除此之外,更重要的是,
我們還發現,「錄音是有秘訣的」。如果要進行AI聽打,在收音上是有訣竅的!

而上述所提,我們都將他精煉出一個個現學現賣、熱騰騰的程式模組,如果讀者有興趣,歡迎至「速學Python語音轉字檔Workshop」中查看詳細資料! 我們針對早鳥及台科師生校友都有課程優惠價格喔!

導入AI聽打解決方案… 更具體的效果評估?
話又說回來,AI聽打跟我有什麼關係? 讓我們以打字行、數位媒體製作公司舉例之:

對數位媒體的影響
如果您是有接數位媒體影片製作經營者,連同字幕檔案也要上上去,我們以一小時影片檔案估算

原本的經營模式:
成本:1300元/人1小時 
假設處理完1小時錄音檔案該數媒專員連帶處理,要花我2小時
人工成本: 1300*2  = 2600元(不考慮其他營業成本)
使用AI聽打:
成本:1300元/人1小時
AI聽打成本:45元/1小時
假設處理完1小時【AI處理過】的錄音檔案給該數媒專員連帶處理,要花我1.3小時
稅前淨利: 1300*1.3-45 = 1645元(不考慮其他營業成本



使用AI聽打預處理 + 人工相較於全人工處理,一小時成本省了2600–1645 = 955。假設一個月生意是100小時影片,那就差了新台幣95,500元,可見有使用AI聽打與純人工的狀態下,試算出來的利益空間還真是可觀。

對打字行的影響
如果您是打字行的經營者,我們以一小時錄音檔簡單計算使用AI聽打及不使用AI聽打的營收與成本為例:

原本的經營模式:
營收:1600元/1小時
成本:1150元/人1小時 
假設處理完1小時錄音檔案給專業人士來處理,要花我1.3小時
稅前淨利: 1600 - 1150*1.3  = 105元(不考慮其他營業成本)
使用AI聽打:
營收:1600元/1小時
成本:1150元/人1小時 
AI聽打成本:45元/1小時
假設處理完1小時【AI處理過】的錄音檔案給專業人士來處理,要花我0.小時
稅前淨利: 1600 - 1150*0.9-45 = 520元(不考慮其他營業成本)

使用AI聽打預處理 + 人工相較於全人工處理,一小時淨利增加了520–105 = 415。假設一個月生意是300小時,那就差了新台幣124,500元,可見有使用AI聽打與純人工的狀態下,試算出來的利益空間還真是可觀。

如果對AI聽打有興趣,歡迎至
「速學Python語音轉字檔Workshop」

查看詳細資料! 我們針對早鳥及台科師生校友都有課程優惠價格喔!

作者:
鍾皓軒(臺灣行銷研究有限公司 共同創辦人)

留言

這個網誌中的熱門文章

淺談資料類型 — 初級資料與次級資料

淺談資料類型 — 研究資料

淺談資料類型—企業內部資料和外部資料