富源語音轉寫針對語音的長時相關性進行語言建模,將音頻數據轉換成文本數據,為后續的信息處理和數據挖掘提供基礎。 具體表現形式為,將多種格式的長段音頻文件(暫只支持10M以內)轉換成包含時間戳、詞屬性以及句子標志的文字信息。
###
轉寫的是已錄制音頻(非實時),音頻文件上傳成功后進入等待隊列,待轉寫成功后用戶即可獲取結果,返回結果時間受音頻時長以及排隊任務量的影響。如遇轉寫耗時比平時延長,大概率表示當前時間段出現轉寫高峰,即有任務積壓排隊,屬正常現象,請耐心等待。
### 注:
1. 文法格式智能轉換包括電話號碼、車牌、日期、時間以及量詞的規整,如“五點三十”引擎會識別規整為“5:30”。
2. 詞屬性包括:普通詞;語氣猶豫詞,如“嗯”、“啊”、“呃”或者無意義的重復詞等;標點符號,如“,”等。
3. 語音轉寫的識別文字結果為異步獲取,最長12小時之內獲取。
#
#
#