ASR語音辨識
myVoca全新誕生
1 / 1
1.根據第三方驗證測試報告,在相同硬體規格(NVIDIA RTX PRO 6000 Blackwell)測試環境下,當維持平均反應延遲(Latency)於1秒內之測試基準時,「myVoca」模型可支援之最高併發辨識線數為60線,而 OpenAI Whisper-large-v3 僅能支援8線。依此運算效率推估,在處理相同規模之高併發需求時,「myVoca」模型所需之硬體部署成本顯著低於 OpenAl Whisper-large-v3。
2.根據第三方驗證測試報告,「myVoca」模型在處理「政府質詢會議」之國語語音資料(總時長約13小時44 分鐘)時,,其字正確率(Character Accuracy Rate)實測結果為96.70%(約97%)。實際辨識準確率可能因原始音檔品質、環境背景噪音及口說清晰度而有所差異。
3.根據第三方驗證測試報告,在相同硬體規格(NVIDIA RTX PRO 6000 Blackwell)測試環境下,「myVoca」模型採用即時出字演算法,經實測其平均反應延遲時間(Latency)小於1秒。即使在同時併發60線重度負載之測試壓力下,「myVoca」模型仍能維持平均延遲於1秒內之即時轉錄水準;相較之下,OpenAI Whisper-large-v3 在相同60線負載下之平均延遲約需6.5秒。實際辨識速度可能因用戶端網路環境及硬體配置而有所差異。