たしかは、音声入力を3段階で補正し、初期結果、用語補正、文章整形を並べて確認できるAPIです。
公開デモは短い検証用です。秘密情報を含む音声は送らないでください。 商用利用・導入のご相談: kan@2-38.com
短いサンプルで、技術語の補正と文体整形を確認できます。
第1段階 -> 第2段階 -> 第3段階
音声から文字にした初期結果
まだ実行していません
用語や固有名詞を補正
まだ実行していません
選択した文体モードで読みやすく整える
まだ実行していません
JRMと同じく、公開デモは実APIの入口を同一originで叩きます。
まず音声から文字にした初期結果を表示します。ここで入力の癖を見ます。
技術語、サービス名、英字表記を辞書と文脈で補正します。
文脈ヒントと文体モードを使い、意味を足さずに読みやすく整えます。
本利用はアカウントIDを発行して、通常のarchive APIを使います。
# Accountless public demo curl -sS \ -F "file=@voice.wav" \ -F "style_mode=preserve" \ -F "transcript_context=専門用語と固有名詞を優先表記にしてください。" \ "https://voice.2-38.com/v1/demo/transcriptions"