Android 中的實時轉錄和字幕對聽障人士來說是福音

Android 中的實時轉錄和字幕對聽障人士來說是福音

Android 的一組新功能可以緩解聽力障礙和其他疾病患者的一些困難。 實時轉錄、字幕和中繼使用語音識別和合成,讓您可以更實時地訪問手機上的內容。

今天在 Google 的 I/O 大會上宣布了一段關於可訪問性的令人驚訝的長段,這些功能都依賴於改進的語音到文本和文本到語音的算法,其中一些現在在設備上運行,而不是將音頻發送到數據要解碼的中心。

谷歌已經提到了要突出顯示的第一個功能,即實時轉錄。 這是一個簡單但非常有用的工具:打開應用程序,設備將聆聽周圍環境,並在屏幕上簡單地將其識別的任何語音顯示為文本。

我們已經在翻譯應用程序和設備中看到了這一點,例如 One Mini,以及昨天在 Microsoft Build 上突出顯示的會議轉錄。 人們會認為這樣一個簡單的工具早就應該出現了,但實際上,對於在完美錄製的單揚聲器音頻上訓練的自然語言系統來說,像在咖啡館裡與幾個朋友交談這樣的日常情況可能非常困難。 將系統改進到可以跟踪多個發言者并快速顯示準確的成績單無疑是一個挑戰。

由這種改進的語音識別能力實現的另一個功能是實時字幕,它的作用與上述基本相同,但適用於視頻。 現在,當您觀看 YouTube 視頻、收聽語音消息甚至進行視頻通話時,您將能夠實時看到視頻中的人在說什麼。

這應該被證明是非常有用的,不僅對數以百萬計的人聽不到正在說的話,而且對那些語言不好但可以使用文本支持的人,或者在他們應該靜音的時候觀看節目的任何人去睡覺,或在聽力和理解語音不是最佳選擇的任何其他情況下。

顯示電話對話的 Gif 現場字幕。首席執行官 Sundar Pichai 表示,電話字幕仍在開發中,但他們在舞台上演示的“實時轉播”功能展示了它的工作原理。 一個有聽力障礙或不能說話的人,肯定會覺得一個普通的電話毫無價值。 但是實時中繼立即將呼叫轉換為文本,並立即將文本響應轉換為線路上的人可以聽到的語音。

Android Q 發佈時應該可以使用實時字幕,但有一些設備限制。 實時轉錄現已可用,但警告指出它目前正在開發中。 現場接力尚未到來,但以如此完整的形式在舞台上展示表明它不久就會出現。

Leave a Reply

Your email address will not be published. Required fields are marked *