• <em id="6vhwh"><rt id="6vhwh"></rt></em>

    <style id="6vhwh"></style>

    <style id="6vhwh"></style>
    1. <style id="6vhwh"></style>
        <sub id="6vhwh"><p id="6vhwh"></p></sub>
        <p id="6vhwh"></p>
          1. 国产亚洲欧洲av综合一区二区三区 ,色爱综合另类图片av,亚洲av免费成人在线,久久热在线视频精品视频,成在人线av无码免费,国产精品一区二区久久毛片,亚洲精品成人片在线观看精品字幕 ,久久亚洲精品成人av秋霞

            基于云平臺的智能語音交互機器人設計

            更新時間:2024-03-11 04:15:46 閱讀: 評論:0

            2024年3月11日發(作者:日托)

            基于云平臺的智能語音交互機器人設計

            24卷第

            4

            2021

            4月

            文章編號

            2096-1472(2021)-04-55-05

            軟件工程

            SOFTWARE

            ENGINEERING

            Vol.24

            No.4

            Apr.

            2021

            D0I:10.19644/2096-1472.2021.04.013

            基于云平臺的智能語音交互機器人設計

            吳昔遙

            周曾豪

            楊東澤

            (空軍預警學院

            湖北武漢

            430019)

            ****************

            ;

            *****************

            ;

            *****************;

            *****************

            ;

            *****************

            現有的語音交互機器人多采用用戶提問

            機器人回答的單向交流方式

            人機交互的智能性和靈活性較

            本文研究運用樹莓派

            (Raspberry

            Pi)

            計算機和配套的語音板作為硬件載體

            融合語音喚醒

            語音識別

            語音合成

            自然語言處理等人工智能技術

            調用科大訊飛開放云平臺

            在線圖靈機器人

            搭建一種基于云平臺的智能語音交互機器

            人系統

            并結合自主開發的本地知識庫和問題庫

            使智能語音交互機器人能夠根據不同環境與任務需求實現雙向互動交

            實現由機器人采集信息和交流反饋

            以提供高適應性的無接觸人機語音交互服務

            關鍵詞

            :人工智能

            自然語言處理;

            語音交互機器人

            樹莓派

            云平臺

            中圖分類號

            TP24

            文獻標識碼

            A

            Design

            of

            Intelligent

            Voice

            Interactive

            Robot

            bad

            on

            Cloud

            Platform

            HE

            Song,

            HUANG

            Wei,

            WU

            Xiyao,

            ZHOU

            Zenghao,

            YANG

            Dongze

            (Air

            Force

            Early

            WarningAcademy,

            Wuhan

            430019,

            China)

            *****************

            ;

            *****************

            ;

            *****************

            ;

            *****************

            ;

            *****************

            Abstract:

            Existing

            voice

            interactive

            robots

            mostly

            u

            ur

            questions

            and

            the

            one-way

            communication

            method

            of

            robot

            answers,

            which

            is

            less

            intelligent

            and

            flexible

            in

            human-computer

            interaction.

            This

            paper

            propos

            to

            build

            an

            intelligent

            voice

            interactive

            robot

            system

            bad

            on

            cloud

            platform.

            The

            propod

            system

            us

            Raspberry

            Pi

            computer

            and

            the

            supporting

            voice

            board

            as

            hardware

            carriers,

            and

            integrates

            artificial

            intelligence

            technologies

            such

            as

            voice

            wake-up,

            voice

            recognition,

            speech

            synthesis,

            natural

            language

            processing.

            It

            also

            makes

            u

            of

            the

            rvices

            of

            IFLYTEK

            open

            cloud

            platform

            and

            online

            Turing

            robot.

            Combined

            with

            lf-developed

            local

            knowledge

            ba

            and

            question

            library,

            the

            intelligent

            voice

            interactive

            robot

            can

            conduct

            two-way

            interactive

            communication

            according

            to

            different

            environment

            and

            task

            requirements,

            collect

            information,

            and

            exchange

            feedback.

            It

            provides

            highly

            adaptable

            contactless

            human-machine

            voice

            interaction

            rvice.

            Keywords:

            artificial

            intelligence;

            natural

            language

            processing;

            voice

            interactive

            robot;

            Raspberry

            Pi;

            cloud

            platform

            1

            引言

            (Introduction)

            隨著人工智能技術的快速發展

            深度學習在語音技術領

            域取得突破性進展

            1

            與此同時

            在互聯網快速發展的驅動

            語音識別技術的研究工作始于

            20

            世紀

            50

            年代

            至今已經走

            70

            年的歷程岡

            在國內外被廣泛研究

            7

            ]。

            2011

            年的蘋果第四代語

            音助手

            Siri

            的出現

            帶來了國外語音交互產業的高峰期

            8

            2014

            年亞馬遜的智能音箱

            Ech

            o

            是人機交互技術進入家庭電器產業

            的重要節點

            9

            隨著深度學習算法升級

            硬件計算能力提升

            大量數據不斷參與訓練優化模型

            語音識別和自然語音理解

            ,云端技術架構不斷成熟穩定

            基于語音的人機交互技術

            應用越來越廣泛

            涵蓋教育

            醫療

            家居等各行業領域

            2

            服務機器人

            情感交互機器人

            教育機器人等

            3

            在語音交互

            方面

            云端保存著由海量數據通過深度學習訓練而成的各種

            模型

            4

            并通過其強勁的處理能力為終端提供諸如語音識別

            語義理解

            語音合成等計算量較大的服務

            5

            不斷取得突破性進展

            國內領先的科大訊飛

            百度等公司語

            音識別準確率達

            97%

            以上阿

            語音交互技術鏈條不斷成熟

            ,讓

            機器人具備語音交互功能已然成為一種趨勢

            本文主要研究

            56

            軟件工程

            2021

            4月

            整合現有資源

            調整傳統語音交互系統軟件設計方案

            基于

            云服務平臺和

            ROS(Robot

            Operating

            System)

            框架

            設計智

            能語音交互系統

            并且可以安裝于小型集成計算機上

            作為

            安裝于病房內的

            智能語音交互機器人

            降低語音交互系

            統開發難度和研發成本

            使無接觸式就醫得以實現

            并且擴

            展應用功能

            2

            語音交互模塊需求分析

            (Demand

            analysis

            of

            voice

            interaction)

            通過分析疫情防控與病情監測等環境的需要

            我們構想

            將自然語言處理(

            Natural

            Language

            Processing

            NLP)

            技術

            整合應用至機器人

            實現信息采集和交流反饋的主要功能

            最終以文本+語音的形式進行輸出

            人工信息采集工作重復

            枯燥且效率較低

            采用機器人進

            行信息采集相當于機器人提問

            ,人來回答,

            可以實現自動化

            智能化和高效化

            信息采集技術路線

            (

            1)

            預置問題庫

            (

            2)

            將問

            題文本轉語音輸出

            (

            3)

            采集用戶回答的語音

            (

            4)

            調用語音識別

            模塊將語音轉文字

            (

            5

            )

            提取用戶回答的文本中的關鍵詞信息

            (6)

            將對應的問題和回答作為采集的信息存入數據庫

            交流反饋則是機器人通過采集聲音信號

            檢測語音信

            傳輸至本地知識庫和云端服務器中尋找相應匹配信息

            確認答案后以語音和文本的形式輸出反饋

            。人機交互式的信

            息采集與交流反饋既可以從病毒傳播途徑上降低傳染風險

            又能夠利用預設問答庫完成反饋

            有效節約了人力資源

            3

            智能語音交互機器人總體設計

            (O

            verall

            design

            of

            intelligent

            voice

            interactive

            robot)

            智能語音交互機器人的整體框架有兩層

            云端服務平臺

            位于云端服務器(本例中采用科大訊飛開放云平臺作為云端

            服務器

            )

            云端保存著由海量數據通過深度學習訓練而成的

            各種模型

            可降低終端的解析壓力

            為系統提供一系列在線

            支持

            主要是對本地計算機向云端發送的數據包提供解析

            反饋與下載等服務

            一一

            包括語音識別

            語義理解

            語音合成

            本地計算機交互系統主要分為三層

            最底層是物理層

            Linux

            內核

            是系統運行環境(本例中采用

            Ubuntu

            16.04

            ),

            對應的機器人操作系統

            ROS

            版本為

            kinetic

            其次是中間

            該層主要是第三方庫以及

            ROS

            操作系統

            ;最上層稱為應

            用層

            主管系統的業務處理邏輯

            可根據任務需要設置功能

            模塊區

            如在隔離病房中的計算機需具備

            病情匯報

            外交流

            等功能

            系統架構如圖

            1

            所示

            ziUBIH

            藥平臺

            14

            大訊飛開枚云平白)

            11

            第三方零

            1

            ALSAJieba)

            ROSttflifefiE

            LinuxH

            I

            buntulb

            04

            TROS

            蛻炕版

            *

            Kinetic

            1

            系統架構設計

            Fig.1

            Design

            of

            system

            architecture

            3.1

            基于在線云平臺的語音交互

            智能語音交互機器人主要模塊包含語音采集

            語音喚

            語音檢測

            云端識別

            本地知識庫檢索

            圖靈機器人交

            語音合成

            輸出設備播放

            判斷結束

            從而構成邏輯完

            滿足功能需要的語音交互系統

            在線語音交互流程如圖

            2

            所示

            2

            在線語音交互流程圖

            Fig.2

            Flow

            chart

            of

            international

            voice

            interaction

            語音采集是控制麥克風采集音頻將其轉換為可供后續

            流程使用的信號

            在系統中以

            wav

            文件形式保存

            定義

            get-

            audio()

            函數來設定麥克風使用參數

            CHANNELS

            (聲道數)

            RATE(

            采樣率)等

            從而實現麥克風采集數據的功能

            語音喚醒環節是通過識別輸入的音頻信號中特定的詞

            當識別引擎計算得分超過預設的門限值時

            返回喚醒結

            果為

            真”

            回調預設的函數

            進行下一步的處理

            語音檢測是對采集的音頻文件進行分析

            判斷是否有有

            效語音數據輸入

            并且檢測語音文件是否符合識別要求

            際上是對環境噪聲等低相關性的過濾

            以及對不規范音頻文

            件的篩選

            通過對

            CHANNELS(

            聲道數)和

            RATE(

            采樣率)等參

            數的調用判別

            提高采樣精度

            則能更好完善用戶體驗

            語音識別模塊是將語音輸入轉為文本輸入的過程

            基于

            科大訊飛開放平臺所提供的適用于

            Linux

            系統下的軟件開發

            工具包

            (Software

            Development

            Kit

            SDK)

            本地計算機對

            語音提問進行錄制

            檢測并上傳至云端識別引擎

            轉換成文

            本數據后

            通過互聯網重新返回到使用者終端

            通過

            val=os.

            popen

            ()

            函數執行訊飛

            SDK

            包并將返回結果保存在文件中

            利用函數

            readlines()

            循環查詢找到語音識別的結果

            截取結

            ,輸出到用戶終端

            因此

            科大訊飛云端識別

            的步

            驟為止完成了對用戶的語音提問轉為文本數據的過程

            后續

            步驟會進一步提交文本數據進行問答匹配與語音合成輸出

            檢索知識庫是先讀取本地知識庫

            將語音識別出的文本

            數據導入其中匹配

            若存在匹配項

            則返回為

            ,并將

            24

            卷第

            4

            何松等

            基于云平臺的智能語音交互機器人設計

            57

            匹配文本數據導入科大訊飛

            SDK

            文件

            轉語音合成輸出

            不存在匹配項

            則調用圖靈機器人

            將識別出的文本數據進

            行在線檢索

            °Fo=open()

            函數用來打開知識庫

            readlines()

            數將知識庫讀取為列表變量

            進行結果查詢

            本步驟完成了

            問答匹配流程

            并提供了本地知識庫匹配和云端知識庫匹配

            兩種途徑

            語音合成即從文本輸入到語音輸出的過程

            把知識庫匹

            配的答案上傳至云端服務器

            轉為語音數據后返回用戶終端

            播放

            在線語音聽寫和在線語音合成都屬于通過音頻文件

            /

            文本文件向云端識別引擎請求服務并獲得識別結果的方式

            相較于建立傳輸控制協議

            /

            互聯協議

            (Transmission

            Control

            Protocol/Internet

            Protocol,TCP/IP)

            長連接的方式發送實

            時音頻數據流的方式

            前者實時性較差但不必長時間占用計

            算機資源

            通過

            ()

            函數執行科大訊飛的語音合成

            SDK

            文件

            ,以匹配所得的文本數據為對象,

            生成

            wav

            格式的音頻文

            件,并將該文本數據輸出到終端

            實現語音和文字兩種形式

            輸出

            設備輸出音頻是通過調用生成的語音文件輸出給外設麥

            克風實現的

            利用

            ()

            函數調用

            play

            指令播放音頻

            根據合成音頻文件的文本數據長度決定暫停時間長短

            保證

            語音輸出的完整性

            3.2

            離線語音交互

            針對涉密或隱私情況下離線語音交互的需要,

            可將基于

            云端服務器的識別處理轉為發送至本地計算機進行

            通過更

            改各節點間的訂閱關系

            將原發送至云平臺的數據轉發給本

            地程序處理

            以實現離線的語音交互。

            其基本步驟是

            語音交互系統啟動后

            由用戶輸入指定

            喚醒詞

            將系統由待機狀態喚醒至工作狀態

            調用

            system

            ()

            數對用戶的提問進行錄音

            生成指定

            wav

            文件

            利用回調函數

            將該

            wav

            文件輸入科大訊飛離線語音識別

            SDK

            進行識別

            別理解轉化成文本數據返回

            調用

            system()

            函數對文本數據進

            行獲取

            將問題文本數據導入預先編好的本地語料庫中進行

            匹配

            得到對應的回復文本數據

            利用回調函數將該回復文

            本數據輸入科大訊飛離線語音合成

            SDK

            進行合成

            得到特定

            內容的

            wav

            音頻文件

            最后調用

            system

            ()

            函數對合成的

            wav

            頻文件進行播放

            即完成一次完整的語音交互過程

            3.3

            基于語音交互的信息采集

            信息采集功能是通過機器人主導交互實現的

            。利用科大

            訊飛離線的語音合成

            SDK

            文件將設定的問題處理為語音

            通過揚聲器播放出來

            被采集者聽到問題的反饋將被麥克風

            收錄

            ,SDK

            文件將語音文件識別為文本

            提取關鍵詞

            作為

            采集信息

            機器人將問題和對應采集信息存入數據庫

            實現

            了無接觸的信息采集功能

            交流反饋功能是通過使用者主導交互實現的

            先通過語

            音喚醒

            使機器人調用麥克風采集聲音

            然后將聲音信號發

            至基于科大訊飛開放平臺的語音識別模塊

            提取識別結果并

            在知識庫中檢索

            將得到的相關文本發至語音合成模塊

            將輸出結果連入揚聲器播放

            最終反饋至使用者

            信息采集

            與交流反饋流程圖如圖

            3

            所示

            3

            信息采集與交流反饋流程圖

            Fig.3

            Flow

            chart

            of

            information

            collection

            and

            communication

            3.4

            語音交互機器人在病房中的實際應用

            經過對體積與應用性的考量

            該機器人采用樹莓派

            (M4PB

            型)作為硬件載體

            以體積小和集成度高適應便攜性

            需求

            并且應用了科大訊飛開放云平臺的在線資源和本地語

            料庫

            通過將語音數據經由網絡傳輸到云端服務器

            利用云

            計算技術得到識別結果并返回

            云端資源豐富

            可以更好地

            利用知識庫資源

            同時本地語料庫的準備適用于不同情況下

            的不同需要

            分析設計其相對應的資料庫

            并延伸相關的可

            靠性設計與適應性設計

            可以實現更廣泛的用途

            語音交互

            系統采用

            ROS

            節點消息發布和訂閱機制

            °ROS

            是開源的機

            器人操作系統軟件

            提供類似于操作系統的服務

            °ROS

            通過

            將龐大繁雜的系統任務切分成功能單一的子任務

            再通過以

            消息或服務的方式將子任務鏈接起來形成可以完成復雜任務

            的系統

            實現代碼復用

            降低設計難度

            同時

            ROS

            支持

            C

            Pytho

            n

            多編程語言

            功能包豐富

            測試方便

            在通信過程

            節點將消息以特定主題發布到

            ROS

            核心控制器

            ROS

            心控制器異步地將該消息轉發給訂閱該主題的節點進而實現

            通信

            °ROS

            節點消息傳遞示意圖如圖

            4

            所示

            (NNinr

            t?cord

            aode

            tt

            A

            Nlplay

            ?”

            tn

            am

            MAM

            MMM**

            AB

            HM)

            xf_iu_wp

            (

            c

            丿

            MSKkiCVM

            4

            ROS

            節點消息傳遞示意圖

            Fig.4

            Sketch

            map

            of

            ROS

            node

            message

            passing

            58

            軟件工程

            2021

            4月

            4

            優化設計

            Optimal

            design

            由于采樣識別的開放式環境會帶來大量數據和樣本

            造成數據冗雜和過擬合問題

            并且計算機一一識別將會提高

            識別難度并增加運算時間

            進而降低產品的使用壽命

            因此

            語音數據預處理和特征工程

            ,即對數據進行降噪

            轉換和分

            類的專項篩選處理可以節省大量資源并提高語音交互模型性

            本系統從以下四個方面進行處理

            1

            特征提取

            特征提取是通過以相對較低的數據采樣速率將波形數據

            轉換為參數表示形式

            而后進行后續處理和分析來完成的

            這通常稱為前端信號處理

            它將經過處理的波形語音信號通

            過函數如感知線性預測

            PLP

            線性預測編碼

            PC

            和頻率倒譜

            系數

            MFCC

            ,

            轉換成一種簡潔而有邏輯的表示形式

            比實際

            信號更有鑒別性和可靠性

            2

            特征降維

            數據降維是在降低特征數量的同時

            盡可能保留原數據

            主要的信息

            ,利用同一特性的最優特征篩除冗余特征

            最終

            得到對構建模型最有貢獻度的特征

            降維處理后的數據集合

            具有更小的規模

            這樣的集合更易于儲存并且可以有效降低

            運算的復雜性

            還可以大幅降低模型的復雜性

            防止過擬合

            的情況出現

            (3

            特征過濾

            特征過濾是特征選用方法中最為常見和基本的一種

            可以

            通過設立閾值來限制無關數據的輸入

            比如在喚醒程序中設置

            音量閾值,

            可以簡單有效地過濾外部雜音和自身移動碰撞產生

            的噪音

            ,大幅降低運算的復雜程度和運算資源的占用量

            4

            特征構造

            特征構造是建立使用者或使用環境下常見有效輸入的聲

            學模型

            例如在病房中使用時構造出現頻度高的醫學詞匯

            過近似模型來過濾差異較大的無關信息

            將擬合程度高的特

            征信息輸入系統

            大幅減少數據處理量

            語音材料的預處理在特征工程之前進行

            預處理的步驟

            是預強調

            濾波

            一幀阻塞

            將語音信號按幀分割

            一語音信號加

            加漢明窗和矩形窗對信號進行均勻化處理

            以及必要的降

            噪與放大處理等

            5

            實驗結果與分析

            The

            results

            and

            analysis

            of

            experiment

            5.1

            實驗環境

            硬件配置由樹莓派

            4

            B

            樹莓派

            3

            B+

            和語音版組成

            4

            核處理器

            ARMv7

            process

            rev3

            主頻

            1500

            MHz

            內存容

            1.00

            GB,

            磁盤容量

            16

            GB

            搭載

            Ubuntu

            16.04

            LST

            系統

            +

            ROS

            系統

            Linux

            內核版本為

            4.19.75

            v71,ROS

            系統版本

            kinetic

            實驗環境配置如表

            1

            所示

            1

            實驗環境配置

            Tab.1

            Experiment

            configuration

            states

            名稱

            樹莓派

            4

            B

            樹莓派

            3

            B+

            CPU

            1.5

            GHz,Quad-Core

            1.4

            GHz

            Quad-Core

            Broadcom

            BCM2711B0

            Broadcom

            BCM2837B0

            (Cortex

            A-72)

            (Cortex

            A-53)

            內存

            1

            —4

            GB

            DDR4

            1

            GB

            DDR2

            GPU

            500

            MHz

            VideoCore5

            400

            MHz

            VideoCore3

            視頻輸出

            雙微型

            HDMI

            接口

            HDMI

            接口

            最大分辨率

            4

            k

            60

            +1080 P

            2x4

            k

            30

            2560x1060

            USB

            接口

            USB

            3.0

            +

            USB

            2.0

            USB

            2.0

            網絡連接

            千兆以太網

            330

            Mbps

            以太網

            無線連接

            802.11ac(2.4/5

            GHz)

            藍牙

            802.11ac(2.4/5

            GHz)

            藍牙

            5.0

            4.1

            尺寸

            88

            mmx58

            mmx19.5

            mm

            82

            mmx56

            mmx19.5

            mm

            重量

            46

            g

            50

            g

            5.2

            實驗結果

            在線語音交互流程是

            1

            人與智能機器人進行語音交

            互;

            2

            智能機器人通過麥克風對交互語音進行采集

            生成語

            wave

            文件

            3)

            語音識別節點通過互聯網將

            wave

            語音文件傳

            輸到科大訊飛語音識別服務器

            科大訊飛語音識別服務器通

            過智能語音識別算法將語音文件識別并轉換成文本文件,

            過互聯網發回智能機器人終端

            (4

            語言處理節點將識別出的

            文本通過互聯網發送到在線圖靈機器人

            5

            在線圖靈機器人

            通過傳入的文本內容和前后文語境

            在知識庫中查找最佳的

            回復信息

            并通過互聯網傳回智能機器人終端

            6

            語音合成

            節點收到圖靈機器人的文本回復信息后

            將其再次發送到科

            大訊飛云在線語音合成平臺

            7

            科大訊飛云在線語音合成系

            統將文本內容轉換成語音數據

            MP3

            格式文件發給智能機

            器人

            8

            智能機器人通過音頻輸出接口播放回復的語音文件

            完成語音數據輸出

            詢問天氣的語音交互過程如圖

            5

            所示

            |i*ro?

            ?.S?

            wall

            ?*

            7*1

            mn

            菱酸

            2

            八嚴

            5

            *

            用戶詢何武漢".訥的細戰盒儀天

            -

            Mr

            ...............

            ?

            ?

            -

            -

            -

            -

            -

            -

            -

            -Not

            ktartvtf

            隙⑺;鵲窩忌族

            wRlnltC

            )

            lnvok?4

            ...

            or

            already

            stopped.

            <

            w

            "聽

            I

            天亍發送至酥泌人

            1(

            (?$????????.

            J

            get

            pararln?utltr4ng

            rejvrj:

            ?

            I

            豊?■哄空尹心""

            釀雌人站.知天氣毗

            Mt

            nlw

            r??pon?r

            XiXrlt

            .M

            RWJeftR

            ,?

            I*

            aiiiiiQ.M

            ■■氣

            au

            ?

            .

            |l?0lx

            kt??Kon_b*9in_paran*

            ?

            .p

            d

            ?

            Mork

            dir

            ?

            甘三磐聖一

            ?

            1

            ?

            volvM

            ?

            M,

            :

            volc?_na*w

            pVtth

            心黃臺成改漢天氣曠

            ?

            M.

            ?

            rdfl

            >

            ?

            ?

            ?

            utft.

            0

            .

            Incasing:

            str

            ?:

            ?le

            Ch

            ?

            l

            ?

            pla/OaVn:

            ?:

            1*

            I

            Our

            off

            5

            播肢會成的國音

            MtMivr.

            i?out

            tn

            AWJ

            calltraete

            its*

            t

            *?????

            I

            .

            )

            iKia.a

            citpia

            I

            *

            [t

            5

            在線語音交互實驗結果

            Fig.5

            The

            result

            of

            voice

            interactive

            test

            基于語音交互的信息采集是機器人提問,

            由人來回答問

            完成信息采集任務

            。可將問答文本實時合成語音

            也可

            提前把設定好的信息采集音頻合成好

            不用每次信息采集的

            時候當場合成

            提高程序運行效率

            由機器人詢問并采集某

            用戶姓名

            編號

            體溫的語音交互過程如圖

            6

            至圖

            8

            所示

            24

            卷第

            4

            何松等

            基于云平臺的智能語音交互機器人設計

            59

            6

            機器人采集用戶姓名的語音交互過程

            Fig.6

            Flow

            chart

            of

            ur's

            name

            collection

            7

            機器人采集用戶編號的語音交互過程

            Fig.7

            Flow

            chart

            of

            ur's

            number

            collection

            8

            機器人采集用戶體溫的語音交互過程

            Fig.8

            Flow

            chart

            of

            ur's

            body

            temperature

            collection

            通過測試,

            得到語音交互系統的各項參數如表

            2

            所示

            2

            語音交互系統參數

            Tab.2

            System

            parameters

            of

            Voice

            Interaction

            參數數據

            語音識別準確率

            >96%

            問題反饋準確率

            >79.6%

            響應時間

            <5

            s

            6

            結論

            (Conclusion)

            在人工智能技術飛速發展的今天

            智能化的設備已經融

            入人們生活的方方面面

            提高了生活的便捷性

            本文設計了

            應用于疫情防控與病情監測的

            ROS

            智能語音交互機器人

            過對錄入音頻信號的預處理和特征提取

            利用科大訊飛

            SDK

            文件和圖靈機器人模塊

            以及有針對性的知識庫

            同時充分

            考慮信號復雜性

            設計降噪濾波方案

            實現了無接觸式智能

            語音交互

            減輕了醫護人員的工作量并從傳播途徑上降低了

            感染風險

            由于并未考慮多階段對話中復雜邏輯交互的情

            對話時邏輯復雜會對語義理解造成不利影響

            比如上下

            文理解困難

            微型機算力不足等

            因此設計并優化多階段復

            雜邏輯的識別和處理能力將是下一步研究的重點

            參考文獻

            (

            References)

            [1]

            戴禮榮

            張仕良.深度語音信號與信息處理:研究進展與展望

            [J].

            數據采集與處理

            ,2014,29(02):171-179.

            [2]

            林楓亭

            羅藝

            孔凡立

            等一種基于云平臺的智能機器人語音

            交互系統設計

            [J].

            電子測試

            ,2018(Z1):40-42.

            [3]

            楊國慶潢銳

            李健

            等.智能服務機器人語音交互的設計與實

            [J].

            科技視界

            ,2020(09):129

            131.

            [4]

            秦偉.基于語音的人機交互平臺的設計與實現

            [D].

            武漢:華中

            科技大學,

            2019.

            [5]

            Shenzhen

            Aukey

            Smart

            Information

            Technology

            Co.,

            Ltd..

            "AI

            Voice

            Interaction

            Method,

            Device

            And

            System"

            in

            Patent

            Application

            Approval

            Process

            (USPTO

            2)[J].

            Telecommunications

            Weekly,

            2020.

            [6]

            YAO

            D,

            KATIE

            S

            T.

            Bridging

            the

            gap

            in

            mobile

            interaction

            design

            for

            children

            with

            disabilities:

            Perspectives

            from

            a

            pediatric

            speech

            language

            pathologist[J].

            International

            Journal

            of

            Child

            Computer

            Interaction,

            2020:23

            24.

            [7]

            楊加平.面向指控系統的嵌入式語音交互技術設計與實現

            [J].

            機械與電子

            ,2015(04):72

            74.

            [8]

            廖彬全

            羅佩

            馬遠佳.基于智能語音交互系統的翻譯機器人

            [J].

            信息與電腦(理論版

            ),2019,31(17):110—

            112.

            [9]

            陳鑫源.智能語音交互技術及其標準化

            [J].

            電聲技術

            ,201

            &

            42(05):78

            80.

            [10]

            郝歐亞

            吳璇

            劉榮凱.智能語音識別技術的發展現狀與應用

            前景[J].

            電聲技術

            ,2020,44(03):24

            26.

            作者簡介

            何松

            (1988-)

            碩士

            講師.研究領域

            模式識別

            人工

            智能.

            (1999-)

            本科生.研究領域

            自然語言處理.

            吳昔遙

            (1999-)

            本科生.研究領域

            自然語言處理.

            周曾豪

            (

            2000-)

            本科生.研究領域

            自然語言處理.

            楊東澤

            (

            2000-)

            本科生.研究領域

            自然語言處理.

            基于云平臺的智能語音交互機器人設計

            本文發布于:2024-03-11 04:15:46,感謝您對本站的認可!

            本文鏈接:http://www.newhan.cn/zhishi/a/1710101746156819.html

            版權聲明:本站內容均來自互聯網,僅供演示用,請勿用于商業和其他非法用途。如果侵犯了您的權益請與我們聯系,我們將在24小時內刪除。

            本文word下載地址:基于云平臺的智能語音交互機器人設計.doc

            本文 PDF 下載地址:基于云平臺的智能語音交互機器人設計.pdf

            標簽:語音   交互   機器人
            留言與評論(共有 0 條評論)
               
            驗證碼:
            推薦文章
            排行榜
            Copyright ?2019-2022 Comsenz Inc.Powered by ? 實用文體寫作網旗下知識大全大全欄目是一個全百科類寶庫! 優秀范文|法律文書|專利查詢|
            主站蜘蛛池模板: 久久99精品久久久大学生| 亚洲av成人一区国产精品| 国产午夜精品福利91| 四虎在线播放亚洲成人| 四虎国产精品久久免费地址| 国内精品视频区在线2021| 亚洲欧美日本久久网站| 国产69精品久久久久99尤物| 韩国精品视频在线日韩| 天天拍夜夜添久久精品大| 五月婷婷导航| 亚洲真人无码永久在线| 波多野结衣一区二区三区高清 | 成 人色 网 站 欧美大片| 日本国产亚洲一区二区| 精品一区二区三区不卡| 亚洲日韩av无码| 日韩有码精品中文字幕| 亚洲精品成人午夜在线| 亚洲一区二区三午夜福利| 亚洲中文字幕97久久精品少妇| 日韩av一区二区三区在线| 国产乱色国产精品免费视频 | 亚洲国产精品热久久一区| 开心五月婷婷综合网站| 亚洲国产精品色一区二区| 日夜啪啪一区二区三区| 精品黄色av一区二区三区| 久久精品国产亚洲AV成人毛片| 中文字幕日韩一区二区不卡| 日本公与熄乱理在线播放| 亚洲av乱码一区二区三区| 亚洲国产精品国自拍av| 国产成人美女视频网站| 自拍偷自拍亚洲精品播放| 天堂av资源在线免费| a级国产乱理伦片在线观看al| 国产在线亚州精品内射| 午夜免费视频国产在线| 色偷偷亚洲女人天堂观看| 成年在线观看免费人视频|