亚太日报 - 聚焦亚太发展，每日新闻快报，学者创作中心

Sam Lessin 最近寫了一篇叫做 Time to Hang Up on Voice（是時候和語音說再見了）的文章，稱語音不可能是未來 UI 交互的發展趨勢。他主要提出了 3 個理由：第一，語音在公共場所嘈雜的壞境下很難被機器分辨和翻譯，同時公共場所人多耳雜，用戶隱私是一大問題；第二，對著機子說話比直接打字或者使用手勢的效率來得低；第三，鍵盤這類工具更適合文字編輯。

但是 Redpoint VC 的 Tomasz Tunguz 有截然相反的看法。他在 The Fastest User Interface 一文中指出，Sam Lessin 只要考慮到一點就知道自己錯了：速度。

語音輸入要比文字輸入來得快。Barbara Blackburn 擁有打字速度最快的世界紀錄，也就每分鐘 212 個單詞，而說話速度最快的世界紀錄得主 Steve Woodmore 每分鐘可以說 637 個單詞。也就是說，在人類自身的極限上，語音要比文字快 3 倍。而正常的普通人，打字速度大概在 30-40 個單詞 / 分鐘，說話速度大概在 120 個單詞 / 分鐘，依然是 3 倍關係。可見，這一比率關係是比較穩定的。

打字速度可以基本轉化為 UI 交互速度，說話說多快卻不見得 UI 交互能多快，因為機器還要翻譯語音的時間。然而需要指出的是，基於未來的 UI 發展，語音技術會大面積減小語音轉化為交互的時間，而文字輸入幾乎已經沒有多少可以提升的空間了。

Tomasz 認為，正是因為速度的原因，我們更習慣給別人打電話而不是發郵件。他嘗試學習 Dvorak 來改進打字的速度，但發郵件比起打電話還是慢太多了。也因此，語音郵件看起來似乎更有吸引力，更方便，也更人性化。

他還指出，Siri 和谷歌語音搜索的成功也是受益於語音的速度。使用語音搜索時，每日搜索量將達到驚人的數以億計。直接說“導航到 XXX或者“查詢舊金山的天氣情況畢竟要比在狹小的鍵盤上一個一個的打字來得快得多。

至於公共場所的語音問題，Tomasz 認為，人們事實上早就習慣了這一點。因為電話早已發明了一百多年了。聲音去噪技術和社會道德意識讓聲音保真和隱私問題不再難以解決。

對於語音，真正的挑戰其實是編輯問題。文字的再編輯很直觀、很容易，語音如果想進行修正和再編輯，難度就高得多。如果再編輯的內容過多的話，語音結合鍵盤和滑鼠或許是個好方式，起碼會比單純使用鍵盤來得快。

事實上，語音永遠不會成為單一的 UI 對話模式。如果兒童在學校都利用語音代替打字的話，後果將難以想像。語音可能永遠無法成為顯性的 UI 對話模式。

但隨著語音辨識技術的發展，MotoX，Moto Hint 和 Google Glass 的面世，語音因為速度快的優點在未來的 UI 交互和人機交互上一定會變得越來越重要。

未來的 UI 交互一定是多種方式相結合來進行的，而語音會是其中重要的一種對話模式。打字、手勢操作、語音、眼球、腦電波等等多種對話模式的融合，或許會是未來介面設計的趨勢。

語音還是文字？未來UI設計趨勢大PK

Latest coverage

Special Featured

China's "HYSY 295" vessel begins maiden Brunei marine mission

What to expect at upcoming Trump-Putin summit in Alaska?

Consumption gains steam, drives growth

Carbon Journey : China's green future (coming soon)

Chinese film on Nanjing Massacre makes US debut