RM新时代官方网站下载

  • 您好,歡迎訪(fǎng)問(wèn)深圳市榮泰電子有限公司官網(wǎng)!

     歌爾股份、歌爾微、歌爾光學(xué)核心代理 

    0755-235715500755-23204616
    深圳市榮泰電子有限公司

    行業(yè)新聞

    新聞動(dòng)態(tài)

    聯(lián)系我們

    深圳市榮泰電子有限公司

    地址:深圳市寶安區西鄉金海路華盛輝商業(yè)大廈8樓

    電話(huà):0755-23571550、0755-23204616

    傳真:0755-23218515

    銷(xiāo)售一部總監:黃生 13590196383

    銷(xiāo)售二部總監:高生 13823610165

    網(wǎng)址:http://m.immaster.cn

    十步,智能音箱從入門(mén)到放棄

    發(fā)布時(shí)間:2021-10-15作者來(lái)源:榮泰電子瀏覽:1788

    忽如一夜春風(fēng)來(lái), 智能音箱遍地開(kāi)。國外有Amazon Echo,Google Home,Microsoft Invoke,Apple HomePod……筆者也與高通保持交流,對方也在積極推智能音箱設計平臺。國內巨頭有BAT磨拳檫掌,內容商有喜馬拉雅發(fā)布了自己的小雅音箱,終端廠(chǎng)商也各自積極尋找合適的方案。應運而生的,深圳的音箱方案商也不出意外地滿(mǎn)大街啦。

     

    那么問(wèn)題就來(lái)了——如何才能做好一個(gè)智能音箱呢?



    十步,智能音箱從入門(mén)到放棄



    對于如何做好一個(gè)智能音箱,筆者腦海里面先浮現的是讀書(shū)那會(huì )兒圖書(shū)館、書(shū)店里面不斷沖擊眼球的《21天,C++從入門(mén)到精通》。當然,很多時(shí)候讀完的感覺(jué)是,這個(gè)書(shū)名應該改為《21天,C++從入門(mén)到放棄》,原因無(wú)他,C++博大精深、功能強大、涉及面極廣。類(lèi)比智能音箱,筆者也嘗試撰寫(xiě)一篇短文,不需要21天,只需要10步,智能音箱就可以從入門(mén)到放棄了。



    1
     

    市場(chǎng)定位

     


    2017年6月4日,“定位之父”杰克·特勞特先生去世,享年82歲。但是他提出的“定位”(Positioning)理論將繼續指導大家的經(jīng)濟活動(dòng)。具體到智能音箱,尤其是在國內,如何在這波熱潮里面定位自己,非常重要。一個(gè)簡(jiǎn)單的例子,是打算自己推產(chǎn)品?還是打算國內的通行做法,左手產(chǎn)品、右手方案?如果是后者,那么自己樹(shù)標桿的產(chǎn)品采用什么方案?提供給客戶(hù)的方案又需要如何滿(mǎn)足不同的客戶(hù)價(jià)格區間?


    圖片

    看著(zhù)上表,再看看國內對于TTM(Time To Market) & Cost的割喉競爭,這一步估計已經(jīng)有不少公司放棄啦。


    2

     

    外觀(guān)設計

     


    音箱外觀(guān)是[敏感詞]眼印象,重要性不解釋?zhuān)?jiàn)下圖:


    圖片


    這也就不難解釋為何那么多方案商給出的參考設計都是圓柱體,外形大體一樣——雖然我不出挑,但我也不挨罵啊。

     

    各位看官,設身處地,如果自己沒(méi)有蘋(píng)果的江湖地位,面對吃瓜群眾對音箱外觀(guān)仁者見(jiàn)仁智者見(jiàn)智地點(diǎn)評,是否有強大的心臟可以支持自己繼續走到第三步?


    3

     

    聲學(xué)結構

     


    其實(shí)外觀(guān)設計和結構設計是密切相關(guān)的,大家都希望設備輕巧可攜帶,音效又特好,外殼還柔性,但外觀(guān)設計這一飄逸藝術(shù)家的活,被結構要求的技術(shù)工科男懟了。要想低音好,需要加些料;要想播歌期間識別好,Mic喇叭[敏感詞]分開(kāi)擺。這左一條、右一條、上一條、下一條的設計原則,讓音箱慢慢變大、變高,也就很難看到類(lèi)似藍牙音箱那種捏在手里陪你慢慢跑步的智能運動(dòng)音箱了。

     

    各位做方案的朋友們,更要對這個(gè)上心啦,因為結構設計得好,大家一時(shí)感覺(jué)不了,結構設計得不好,整體效果就大打折扣。當然,結構設計的好,不妨展示自家的透視圖,妥妥地工程美學(xué)。雖然大家都吐槽蘋(píng)果外形,但是[敏感詞]這張還是蠻出挑的。 


    圖片


    4

     

    內容整合

     


    所謂的智能音箱,首先還是個(gè)音箱,自然要考慮播放歌曲的效果。上面談到的聲學(xué)結構,也是首先要確保播放音效。但是歌曲內容的覆蓋度,也是[敏感詞]重要的事情。光有好的音效聲學(xué)結構,沒(méi)有音樂(lè )源,那就是修了高速沒(méi)有車(chē)跑了。國內在這一塊合縱連橫,但主動(dòng)權還是掌握在音樂(lè )版權商手里。有決心涉足于此的大廠(chǎng),這一塊的合作和成本是必須要考慮的事情了。


    由于市場(chǎng)已有方案的示范效果,智能音箱除了播放歌曲,各種有聲讀物、唐詩(shī)宋詞、外文翻譯,也是題中應有之意。每一塊內容的整合,都是需要認真規劃的。喜馬拉雅近日發(fā)布小雅音箱,其中一個(gè)大的出發(fā)點(diǎn)和訴求點(diǎn)就是自身的內容優(yōu)勢。


    從積極的角度看,為內容,尤其是為高質(zhì)量的內容付費,是我國知識產(chǎn)權走向更為成熟的標志之一,也杜絕了部分市場(chǎng)參與者賺快錢(qián)、撈一把就走的心態(tài),這樣的氛圍更有利于打造精品,助力消費升級。


    5

     

    系統優(yōu)化

     


    說(shuō)了這么多,終于開(kāi)始進(jìn)入到產(chǎn)品本身了,那么如在定位中所提及的,在選定系統平臺后,各種系統優(yōu)化的工作就要安排了。很多做智能音箱的,把眼睛盯在遠場(chǎng)喚醒、打斷、識別上面,其實(shí)系統優(yōu)化的[敏感詞]步,遠遠沒(méi)有到那一塊。目前的智能音箱均是WiFi音箱,那么開(kāi)機速度、聯(lián)網(wǎng)便利性就是用戶(hù)除外觀(guān)以外的第二第三體驗了。開(kāi)機速度自然是越快越好,聯(lián)網(wǎng)自然是成功率越高越好,操作越簡(jiǎn)單越好。但是很多音箱,開(kāi)機大于1分鐘,聯(lián)網(wǎng)重連概率高,還比較挑路由器和網(wǎng)絡(luò )設置。這個(gè),怎么說(shuō)呢,想象一下小輩買(mǎi)了個(gè)音箱回家孝敬老人,心情愉快地上電,默默地等待幾分鐘,后自己也折騰半天還無(wú)法聯(lián)上網(wǎng),這個(gè)畫(huà)面就比較尷尬了。

     

    其次系統功耗也很重要,先不說(shuō)可攜帶音箱,即使是家中的音箱,雖然一直連著(zhù)電源,但是播放一段時(shí)間后,播出千分音,但更放出萬(wàn)分熱,就比較麻煩了。功耗牽涉到CPU的選擇,休眠時(shí)降頻的處理,也牽涉到一直運行的計算,比如語(yǔ)音待喚醒的功耗,都是考驗一個(gè)技術(shù)團隊的重要方面。

     

    沒(méi)有系統的駕馭能力,止步于此是一個(gè)不錯的選擇了。


    6

     

    遠場(chǎng)Mic陣列

     


    好了,支撐整個(gè)智能音箱的AI終于要登場(chǎng)了,這是一個(gè)極為復雜的系統,涉及到感知技術(shù)、認知技術(shù)以及交互技術(shù)。下圖給大家一個(gè)整體印象。


    圖片


    這第六步也就是感知技術(shù)的[敏感詞]環(huán),遠場(chǎng)Mic陣列。這是智能音箱的基礎技術(shù)之一,有了它,遠距離、噪聲環(huán)境下的良好交互才成為可能,大家也可避免需要用手去觸摸音箱才能操作,甚至可以在臥室控制客廳的音箱。簡(jiǎn)單地說(shuō),Mic陣列是解決“耳朵”的問(wèn)題。

     

    以家居環(huán)境為例,遠場(chǎng)語(yǔ)音拾取,必然需要考慮去除由于墻壁等反射導致的混響,家居各種設備產(chǎn)生的背景噪聲,其他用戶(hù)的人聲干擾以及電視機自身產(chǎn)生的回聲。目前市面上Mic陣列主要分為2Mic陣列和多Mic陣列。

     

    Google Home采用的就是2Mic陣列,這個(gè)方案[敏感詞]的好處是結構簡(jiǎn)單,實(shí)施落地方便,凸顯了Google做平臺的特質(zhì)。原因也很簡(jiǎn)單,在音箱上打兩個(gè)孔,無(wú)論是確保在一條直線(xiàn)上(這個(gè)其實(shí)是廢話(huà)了,兩點(diǎn)確定一條直線(xiàn)),還是一個(gè)平面上(似乎也是句廢話(huà)),都非常簡(jiǎn)單。缺點(diǎn)是只能支持180°聲源定位,定位角度的區分度也弱一些。

     

    Amazon采用的是6+1 Mic陣列,支持360°聲源定位,但是聲學(xué)結構設計,乃至后期維護的難度有所提高。2Mic的一致性和6個(gè)Mic的一致性,以及更換出問(wèn)題的概率都有差別。

     

    另外,當前也有一個(gè)有些走偏的思潮,那就是認為Mic越多越好,這個(gè)看法其實(shí)有待商榷的,4個(gè)Mic能解決的問(wèn)題,為啥一定要8個(gè)?成本更低,結構更簡(jiǎn)單,效果一樣,為啥一定要7、8個(gè)呢?這種思潮,既有點(diǎn)像當初大家追求的8核、10核處理器,又有點(diǎn)像鼓吹者只想做個(gè)Demo,根本不考慮量產(chǎn)了。

     

    7

     

    離線(xiàn)喚醒

     


    就像外觀(guān)是整個(gè)音箱的[敏感詞]體驗一樣,喚醒,是智能音箱的[敏感詞]體驗了。說(shuō)喚醒詞后反應遲緩,隔得遠了喊半天不起來(lái),播放歌曲了需要吼才能起來(lái),甚至放在那,莫名奇妙自己叫起來(lái)了,這些產(chǎn)品估計得擔心被用戶(hù)拍小視頻投訴了。

     

    離線(xiàn)喚醒需要關(guān)注以下關(guān)鍵點(diǎn):

     

    快: 反應速度一定要快,[敏感詞]是用戶(hù)話(huà)音剛落,設備就應答了,這給用戶(hù)的感受,就像是有個(gè)隨叫隨到的助手,很有feel。

     

    準: 必須要準確,說(shuō)了喚醒詞就得有反應,否則,喊了半天,尤其是智能音箱經(jīng)常播放音樂(lè ),需要能準確打斷,繼續下達命令。

     

    穩: 沒(méi)事的時(shí)候靜靜地呆在那,主人看電視、接待小伙伴,音箱都不胡亂自己跳出來(lái),給大家意外。這就要求長(cháng)時(shí)間誤喚醒率趨向于0。這一塊其實(shí)是硬功夫,而且需要仔細考察才能選出合適的方案。否則,喚醒光有快和準,后沒(méi)事亂蹦出來(lái),就很煩人啦,沒(méi)準投訴隨之而至。


    8

     

    語(yǔ)用計算(Context-aware NLU)

     


    一般而言,說(shuō)起認知技術(shù),大家討論的都是自然語(yǔ)言處理(NLU),主要目的是讓音箱能準確理解用戶(hù)的意圖。但是,中文博大精深,不同人說(shuō)同一句話(huà),以及同一個(gè)人在不同場(chǎng)合說(shuō)同一句話(huà),意思都不一樣了。例如經(jīng)典笑話(huà):


    A:你這是什么意思?

    B:沒(méi)什么意思,就是意思意思。

    A:你這樣就沒(méi)有意思啦。

    B:哪里哪里,這只是一點(diǎn)小意思。

    A:呵呵,你這個(gè)人真有意思。

     

    這也就提醒我們,光從文字上,實(shí)際上是很難準確地理解用戶(hù)的意圖的。任何語(yǔ)音的交流,都需要考慮一個(gè)核心因素—— 場(chǎng)景化。

     

    所謂的語(yǔ)用計算,就是基于場(chǎng)景化感知的NLU。通過(guò)5W&1H(Who,When,Where,Which,What&How) 原則理解是什么人在什么時(shí)候,什么地方對著(zhù)什么設備說(shuō)了什么話(huà),然后由語(yǔ)用決定如何去回應。

     

    圖片

     

    具體到智能音箱,尤其是還有打算像Google和Amazon一樣把音箱作為家居中控的朋友們,更需要考慮這個(gè)基于場(chǎng)景的語(yǔ)用計算。


    “你好音箱,幫我把燈關(guān)了”—— 是指這個(gè)智能音箱上連接的客廳的燈,還是臥室的?


    “有點(diǎn)冷”,是指這個(gè)笑話(huà)說(shuō)得有點(diǎn)冷,還是音箱上也掛接了空調了?

     

    設身處地,理解用戶(hù)的命令,為用戶(hù)提供合適的應對,才是真正的NLU,也是語(yǔ)用計算的真諦所在。

     

    9

     

    流式交互

     


    前面兩條是感知技術(shù)(耳朵)和認知技術(shù)(大腦),有了這兩條,智能音箱聽(tīng)得到,也聽(tīng)得懂了,那么這款智能音箱可以說(shuō)做到內秀了。但是除了心靈美,也需要良好的溝通才能把音箱豐富的內心帶給用戶(hù)。這就是要靠交互了,為自然的交互自然是語(yǔ)音交互了。但是目前的音箱,所有的交互都是一喚醒再一問(wèn)再一答。這種交互[敏感詞]的問(wèn)題就是——讓人感到生分。每次使用前,需要先喊一聲音箱的名字,然后再下達指令,比如:

     

    先喚醒: “臥龍先生”,然后下達命令“隨便來(lái)首那英的歌”。智能音箱開(kāi)始播放了,這個(gè)時(shí)候改主意了,想換一首韓紅的歌時(shí),又得喊一聲音箱的名字喚醒……

     

    這個(gè)感覺(jué),很像兩個(gè)特別生分的人,無(wú)論何時(shí)何地,請對方幫忙,都要喊一聲全名,“臥龍先生,請你”……“臥龍先生,能否幫我”…… “臥龍先生”……音箱買(mǎi)回家都幾個(gè)月了,大家已經(jīng)很熟啦,為啥一定需要這樣?

     

    另外,面對音箱,用戶(hù)的心態(tài)和面對一個(gè)活生生的人,還是有些差異的。作為一名五好青年,隨意打斷別人說(shuō)話(huà),總是有些不禮貌的,從而內心是抗拒的。但是打斷一個(gè)設備說(shuō)話(huà),或者插話(huà),大家一般還是比較隨意的。


    RM新时代官方网站下载
  • RM新时代投资官网|首入球时间 RM新时代是正规平台吗 rm新世界 RM新时代平台靠谱平台入口-百度知道 新时代RM|国际平台 rm官网怎么登录 RM新时代下载不了 RM新时代还能玩多久 新时代RM官方网站下载 RM新时代资金盘