Tashika.日本語技術語音声入力APIデモを試す
API 公開中アカウント登録なし3段階処理

日本語と技術語の音声を、
あとで直さなくていい文字へ。

たしかは、音声入力を3段階で補正し、初期結果、用語補正、文章整形を並べて確認できるAPIです。

公開デモは短い検証用です。秘密情報を含む音声は送らないでください。 商用利用・導入のご相談: kan@2-38.com

技術語ディクテーションの例
クラウド連携をお願いします
第1段階クラウドれんけいをおねがいします
第2段階クラウド連携をお願いします
第3段階クラウド連携をお願いします。
技術語、固有名詞、文体の差分を3段階で確認できます
10MB
公開デモ上限
10/day
IP別best-effort制限
登録不要
アカウントなしで検証
精度検証

音声ファイルをアップロード

短いサンプルで、技術語の補正と文体整形を確認できます。

POST /v1/demo/transcriptions

最大10MB。公開デモでは音声ファイルをarchiveしませんが、結果metadata/transcriptは運用確認用に保存される場合があります。

たしか Pipeline

第1段階 -> 第2段階 -> 第3段階

3段階処理
第1段階入力

音声から文字にした初期結果

まだ実行していません
第2段階待機

用語や固有名詞を補正

まだ実行していません
第3段階待機

選択した文体モードで読みやすく整える

まだ実行していません
仕組み

速さより、手修正の少なさ。

JRMと同じく、公開デモは実APIの入口を同一originで叩きます。

1

第1段階

まず音声から文字にした初期結果を表示します。ここで入力の癖を見ます。

2

第2段階

技術語、サービス名、英字表記を辞書と文脈で補正します。

3

第3段階

文脈ヒントと文体モードを使い、意味を足さずに読みやすく整えます。

API

登録なしの検証用エンドポイント

本利用はアカウントIDを発行して、通常のarchive APIを使います。

# Accountless public demo
curl -sS \
  -F "file=@voice.wav" \
  -F "style_mode=preserve" \
  -F "transcript_context=専門用語と固有名詞を優先表記にしてください。" \
  "https://voice.2-38.com/v1/demo/transcriptions"
商用利用・導入のご相談

大量リクエスト・業務利用・専門用語辞書の整備など、商用利用のご依頼やご相談は下記までご連絡ください。

kan@2-38.com