當前位置:股票大全官網 - 資訊咨詢 - 充滿聲音的未來是怎樣的?

充滿聲音的未來是怎樣的?

網絡英語早期閱讀課

80萬互聯網同行註意!

專註產品運營設計選擇!

作者:李?尺度?/p & gt;

來源:簡書

編輯:妮子小谷亮

城市沒變,生活變了。

壹、語音發展的現狀

語音學對於很多剛想涉足人工智能領域的人來說是壹個禁忌,因為從很多角度來看,語音學的發展過程是曲折的,目前有幾種情況:

1.語音技術實現困難,預處理過程復雜。

2.語料庫不足,很少有人研究。

3.各方面開放的資源相對匱乏,發展更慢。

現在移動互聯網時代仍然是人們生活中解決問題的主要方式,而媒介就是手機,手機是用接口來傳遞信息的。近年來,人們已經習慣了這種方式,突然切換到沒有接口的語音模式,這種模式在傳遞信息方面相對簡單和緩慢。會有很多矛盾,用起來感覺怪怪的,讓很多產品橫屍街頭。

雖然人工智能得到大力支持,但起步時間尚短,人才供給難以滿足企業需求。企業想要的是能夠在短時間內將技術商業化的成熟工程師,這就消耗了巨大的財力物力。過渡階段的工程師,或者學相關專業的學生,都不足以達到這個標準,而且發音特別明顯,所以市場處於壹種浮躁焦慮的狀態。

第二,語音是人工智能的入口。

但意味著聲音會在發展中逐漸淡化,甚至成為泡沫。我覺得不僅如此,語音才是人們接受人工智能的真正入口,也是未來最常見、應用最廣泛的場景。現在的界面給了人們選擇的空間,信息輸入的多樣性,但人們卻越來越受其影響,效率低下,選擇厭倦,容易沈迷。

就以上,我單獨說壹下。

1.為什麽說語音是入口?

如果妳問壹個普通人,妳覺得壹張圖檢測出車牌號,手機APP把妳喜歡的新聞和產品推送給妳?這是人工智能嗎?他可能不知道是不是,但他可能沒有註意到這些變化。但妳問他,機器說話像人嗎,是人工智能嗎?他會毫不猶豫的肯定,因為說話是判斷壹個人最直觀最自然的方式,而人是不懂算法的。我不知道數據,所以我知道我面前這個冷冰冰的機器可以像人壹樣和我交流,在交流中為我服務。那就是智能,所以語音是最合適的入口。

2.為什麽未來語音應用場景會是最廣泛的?

隨著模型的不斷訓練,醫院可以通過掃描過大量圖片的機器判斷疾病,警察可以通過人臉檢測判斷嫌疑人,金融可以通過相關算法預測股票。但聲音最適合的場景是貼近人們的普通生活、教育、法律、生產。雖然會加入語音,但是機器真正解決人的需求的關鍵點不在這裏。就是改變這些特定領域的輸入輸出方式。其實可有可無,但在普通人的生活中,隨著語音在各種場景的全覆蓋,經過長時間的體驗、適應和改變解決問題的方式,人們會潛移默化地從屏幕中解脫出來,擺脫位置的限制,以最直接的方式隨時隨地接收輸出信息,掌控生活中的壹切,最終享受到生活中很多問題都可以通過說話來解決的狀態。

第三,語音的未來

進壹步想象壹下,語音的普及會是什麽樣的?這將是壹個相互聯系的社會。最近經常聽到這個描述未來的詞。那麽如何實現互聯互通呢?總的來說很抽象很無聊,壹直給語音打廣告有點可疑。那我以後就用妳平常的壹天來講講這種用語音連接的生活。

語音引領萬物互聯。

1.智能音箱喚醒沈睡的人。

未來的某壹天,早上六點,智能音箱在妳還在睡覺的時候把妳叫醒。妳隨便問壹下今天的天氣。在報告天氣之後,它提醒妳今天是冬天的至日。別忘了吃餃子。在妳簡單討論了什麽餡比較好之後,讓說話的人在附近的餐廳點壹盤餃子帶走,註意40分鐘後店家就會送來,因為跑步是妳每天都要做的事情。出門的時候戴上配套的智能耳機,叫醒助手,讓他放幾首平時喜歡聽的歌。跑著跑著,我在公園裏看到了壹些小貓。我忍不住去逗逗看他們,但是我忘記了時間。耳機提醒我,外賣5分鐘後送到。妳開始跑回家,但還是晚了。外賣小哥打來電話,直接用耳機接,叫他放門口。回到家,我摘下耳機。洗完之後,我把音箱叫醒,讓它播報最新消息。壹邊聽,壹邊吃餃子。我的密碼換了好幾個頻道。如果我不感興趣,我就關掉它。

2.車載語音助手陪妳上班

吃完飯開車上班,上車後叫醒車載語音助手,讓它導航現在不堵的路線。畢竟現在是早高峰。剛要開始,突然想起來家裏的燈沒關,就讓助理趕緊把家裏的燈關了,讓它檢查壹下還有沒有別的。確認無誤後,我就放心了。過了壹會兒,車助手提醒妳,有人給妳發微信了。妳讓它讀內容。原來是在家讀書的姐姐今天過生日,妳工作忙忘了。讓助手選壹支200元左右的筆。選好顏色後,助理把圖片發到車載屏幕上。感覺還不錯,就用密碼支付了,然後讓助理給妹妹發了壹個回復“我給妳準備了壹個小禮物”。

3.辦公室揚聲器有助於工作

到了上班的時候,我把辦公室的喇叭吵醒,問妳今天要完成多少任務。我害怕我會懶惰。妳要求它為每件事設定壹個完成時間,然後提醒妳。其中之壹就是妳需要同時給別人發郵件,這樣妳就可以直接把內容想好,告訴妳的助理,讓他發給同事,省去了界面切換的繁瑣步驟。正在努力工作,領導突然讓他下周去外地出差,他趕緊讓助手訂了前壹天的飛機票,訂了機場旁邊的酒店,簡單選了房型,價格後很快訂好,繼續工作。當妳吃完午飯回來,老板通過妳的助理叫妳開會。妳壹邊聽壹邊交流,效率很高。會議室的助理已經把會議紀要謄寫好,發到郵箱裏了,不用擔心遺漏或者遺忘什麽。

4.語音助手幫助妳入睡

下班回家,離開公司,戴上耳機,問給妹妹買的筆送來了沒有,讓助理把家裏的熱水器打開。操作和等待成了壹句話。開車回家,壹個人的生活難免枯燥,所以習慣找個助理陪他聊壹會兒。他什麽都知道,也會打開妳工作中的壹些結。聊天,心情好的時候,讓它看看冰箱裏有什麽菜,推薦幾個可以給妳做的菜譜,選壹個簡單的,邊做邊看,貼心的播放平時喜歡聽的歌,不要覺得舒服。睡覺前跟它說了壹下明天的工作任務,然後我就睡了。明天是新的壹天。

第四,語音的未來應用是普通而廣泛的。

故事平淡無奇,但這平淡無奇的壹面卻是大多數人的生活方式,發音也只有在這平淡無奇的生活中才能發揮其巨大的價值。(故事沒有描述快遞是無人車送的,吃飯的服務員都是自動餐桌或者機器人服務員,樓道裏的清潔工已經是掃地機器人,公司裏或者路上配備的自動診療儀可以隨時檢查身體狀況。我們主要講語音的應用)。

從故事中可以看出,雖然只是壹個普通的上班族,但是在使用語音設備為他服務時,會包括但不限於上述物流、外賣、電商、記筆記、提醒、發消息、導航、看文字、在家聊天、聽歌、接電話、支付、新聞等諸多領域。我們總說互聯網應用場景的豐富給了人工智能更大的發展空間,但正是因為應用場景的豐富。滿足人們生活中的普通需求不是那麽容易的。壹旦場景的豐富度不夠,體驗效果就會降低。如果硬件環境不能覆蓋場景,語音的便利性不能充分發揮,在語音這條路上還有很多事情要做。

使用發音的意義在於增加我們解決問題的效率、多樣性和興趣。我們並不刻意使用發音,但是當我們想隨時快速完成壹件事的時候,自然習慣地說壹句話就能解決,這就需要機器把前期工作做到極致,構建壹個軟硬件豐富的生態圈。

五、語音應用仍需克服的問題

故事中有幾個問題在技術和產品設計上還需要克服:

1.如何將多種硬件(耳機、音箱、家用電器)相互連接控制,軟件互通,內容實時更新。

2.如何用耳機和音箱實現長時間遠距離語音聽寫,同時設計隨時刪除修改的功能。

3.各種票怎麽訂,怎麽進貨?

4.計算機用算法篩選商品不是問題。他們如何以用戶最方便的方式接收結果?

5.如何根據用戶壹段時間的生活習慣,以什麽形式,在什麽時間,主動為用戶推送消息或者主動服務壹些功能?

6.機器可以同時並行做兩件或兩件以上的事情嗎(播放音樂,說菜譜)?

7.聊天的時候,不能總是從底部回復。如何解決百科問題,專業問題,甚至情感需求,以中立的態度,理性的分析,可能不僅僅是技術層面的事情。

8.因為場景的多樣性,妳不可能壹直醒著。如何在不叫醒用戶的情況下提醒用戶日期、日程、新消息和其他信息?

9.如何擺脫界面支付,同時又有很高的安全性?

10.如何控制說話的信息量、節奏、速度、音量,讓用戶不會排斥?

11.如何設計文字、潑水、語音的即時使用,給用戶時間確認。提示?還是復讀?

不及物動詞結論

因為語音的受眾是每壹個普通人,產品的體驗比其他方向更重要。相反,用技術的準確性滿足人就好,所以對交互設計師和產品經理的要求更高。

帶著以上問題,我來總結分析壹下現在AI公司的應用、芯片、開放平臺的布局,看看哪些問題已經解決了,哪些還有很長的路要走,哪些更側重於技術,哪些更側重於設計,有利於公司找到準確的定位、競品、發展方向和解決問題的思路。

提交電子郵件:

這篇文章是李姣寫的嗎?稱重?哎?測量女巫呢?妳有什麽問題?妳懶嗎?懷?瘟疫的數量是多少?哎?哎?哎?折疊?/p & gt;