스마트 폰 음성 제어

스마트 폰 기능의 음성 제어를위한 다양한 솔루션이 있지만 모든 기능이 충분한 품질로 구현되는 것은 아닙니다. 우리는 실제로 작동하는 것을 선택했습니다.

최신 스마트 폰 및 충분히 강력한 CPU가 장착 된 커뮤니케이터로 작업 할 때 음성 제어는 편리한 사용자 인터페이스를 만드는 데있어 확립 된 추세입니다. 모든 주요 모바일 플랫폼에서 다양한 정도가 가능합니다. iOS에서는 버전 3.0 (4.0부터 완벽하게 작동), Google Android에서 버전 1.6 (전체 작동 -2.2부터)에 나타났습니다. 이 기능은 Windows Mobile 및 S60에서 비교적 잘 구현됩니다. 표준 음성 제어 모듈과 기능 확장을위한 소프트웨어를 대체 할 수있는 여러 솔루션을 선택했습니다.

음성 인식 시스템의 주요 특징

지난 2 ~ 3 년 동안 음성 제어는 사용자 인터페이스 생성에 사용되는 가장 유망한 기술 중 하나로 간주되었습니다. 이것은 마이크로 소프트의 리더들이 발표 한 것이며 구글과 애플의 대표자들이 눈에 띄는 관심을 보이고있다.

실제로 버튼을 눌러 이동 통신 장치를 제어하는 ​​것은 이미 고풍스러워 보입니다. 터치 스크린과 음성은 인간이 스마트 장치와 상호 작용할 수있는 자연스러운 방법으로 판매됩니다. 이러한 시스템의 중요한 특징은 명령을 올바르게 인식하는 것입니다. 터치 컨트롤을 사용하면 모든 것이 다소 명확하다면 (현대 스마트 폰은 복잡한 멀티 터치 제스처를 사용하여 제어를 지원하기도합니다) 음성 명령을 사용하는 것은 그렇게 간단하지 않습니다.

첫째, 시스템은 명령이 발음되는 방식에 항상 올바르게 응답하지 않을 수 있습니다. 항상 편리하지는 않지만 이러한 컨트롤에 적응해야합니다. 항상 음성의 음색과 억양을 추적하는 것은 매우 피곤합니다. 이 경우 명령은 계산 리소스가 필요한 일반적인 배경 소음과 분리되어야합니다.

둘째, 이러한 시스템은 자동으로 켜지지 않습니다. 활성화하려면 일반적으로 장치 또는 액세서리 (예 : 무선 헤드셋)의 버튼을 눌러야합니다. 소프트웨어 포함이 항상 편리한 것은 아닙니다. Broadcomm 소프트웨어 스택이있는 Windows Mobile을 사용하는 커뮤니케이터에서 Bluetooth 헤드셋에서 Microsoft Voice Commander를 활성화하면 작동이 불안정하거나 전혀 작동하지 않을 수 있습니다.

셋째, 음성 제어는 아직 사용자의 부정확성과 오류를 수정할 수 없습니다. 예를 들어, 이름에 "the"기사가 포함 된 그룹의 노래를 언급하지 않고 재생하려고하면 대부분의 경우 장치가 이러한 명령을 인식하지 못합니다. 노트북에서 이름을 딴 이름과 이름을 사용할 때도 문제가 발생합니다. 올바른 작동을 위해서는 "별명"필드를 채우고 추가 실행 명령을 할당해야합니다.

넷째, 음성 다이얼링의 지속적인 사용 (예 : SMS 작성시)을 위해 모바일 장치의 프로세서는 인식 시스템의 리소스 집약적 인 모듈을 실행합니다. 이는 커뮤니케이터의 성능과 배터리 수명에 가장 좋은 영향을 미치지 않습니다. 그러나 현재이 문제는 점차 해결되고 있습니다.

Vlingo는 타사 소프트웨어 작업을위한 크로스 플랫폼 음성 제어 모듈입니다.

Speereo Voice Launcher는 음성 제어를위한 다양한 기능을 제공하며 명확하지 않은 발음도 이해합니다.

표준 시스템 기능 및 음성 검색 관리.

널리 사용되는 모든 모바일 운영 체제에서 어느 정도까지는 일반적인 응용 프로그램을 시작하기위한 명령의 음성 인식 가능성이 구현됩니다. 예를 들어 노트북에서 전화를 걸거나 이메일 클라이언트를 열거 나 재생 목록을 시작합니다. 또한 이러한 모듈은 시스템 프로세스를 소리내어 전화기가 부족하거나 무음 경고 모드로 전환되었음을 알립니다. 어떤 프로그램도 더 복잡한 명령을 실행할 수 없습니다 (예 : "이메일 클라이언트를 열고 Mr. Ivanov에게 편지를 쓰고받은 편지함의 모든 메시지를 보낸 후 읽음으로 표시"). 그러나 그들은 점차 발전하고 있습니다. 따라서 iOS4 기반 iPhone에 지금 몇시인지 물어 보면 시스템 시간이 알려집니다. 게다가,이 운영 체제의 동일한 음성 프로그램은 "아니오", "잘못", "잘못"등 사용자의 부정적인 반응을 이해합니다. 다른 모바일 시스템에서는 대신 터치 컨트롤에 의존해야합니다.

클래식 WM 장치에서는 Cyberon Voice Commander 및 Microsoft Voice Command의 두 가지 패키지가 음성 제어에 사용됩니다. 그러나 동시에 사용하면 작동하지 않으므로 하나를 선택해야합니다.

첫 번째는 목록이 그리 크지 않지만 명령을 인식하기 위해 약간의 훈련이 필요합니다. 이 프로그램은 연락처, 캘린더 항목에 전화를 걸고 모든 표준 및 일부 타사 응용 프로그램을 실행하고 음악을 재생하고 수신 메시지를 읽을 수 있습니다. 두 번째 패키지는 볼륨, 무선 연결 작동 모드를 추가로 제어하고 시스템 이벤트를 울립니다. 마이크로 소프트는 최근에 고급 음성 제어를위한 TellMe라는 흥미로운 제품을 내놓았습니다. 정보 요청을 받아 Bing 검색 클라이언트를 시작하고 주가, 스포츠 결과, 날씨, 영화 및 교통 상황에 대해 이야기 할 수 있습니다. 그러나이 모든 것을 위해 장치는 인터넷에 연결되어 있어야하며 GPS 위성의 시야에 있어야합니다. 위치를 계산하는 데 사용되는 도구입니다.또한이 서비스는 러시아어로 제공되지 않습니다.

iOS 및 Android 버전 2.2 이상의 FroYo에서 내장 된 음성 다이얼링 시스템은 Google 제품이지도를 사용하여 특정 회사 또는 특정 지점의 사무실 위치로 경로를 라우팅 할 수 있다는 점을 제외하면 거의 동일합니다. Symbian OS 5th Edition에서 음성 제어는 표준 시스템 기능의 성능 만 담당하며 음성 검색의 경우 별도의 소프트웨어 (예 : Google 모바일 앱)를 설치해야합니다.

추가 기능의 음성 제어 및 타사 프로그램 시작

물론 음성 도구는 커뮤니케이터와의 일상 업무를 부분적으로 용이하게 할뿐만 아니라 일상 활동의 성과를 완전히 장악해야합니다. 그리고 표준 프로그램뿐만 아니라 사용자가 추가로 설치합니다. 이러한 목적을 위해 별도의 제품 (예 : Speereo Voice Launcher)을 사용할 수 있습니다. 이 프로그램은 Symbian OS (S60 포함), Windows Mobile 및 향후 Android OS와 호환됩니다. 모든 응용 프로그램 및 파일의 시작을 예약하고 브라우저의 모든 웹 페이지로 전환 할 수있는 컴팩트 셸입니다.

제품은 소유자 음성의 특성에 크게 의존하지 않습니다. 인식 엔진은 악센트 또는 사소한 사전 결함으로 발음되는 명령을 감지 할 수 있습니다. 표준 프로그램 (노트북, 전자 수첩, 인스턴트 메시지 클라이언트)과의 통합이 제공되지만 즐겨 찾기에서 북마크를 전송할 수 없습니다. 시작 명령의 정의는 응용 프로그램 설정을 통해 수행됩니다. 사용자는 라틴어 또는 지원되는 언어 (영어, 독일어, 프랑스어 등) 중 하나로 러시아어로 명령 이름을 작성한 후 데이터베이스에 입력합니다. 흥미롭게도 Speereo는 시끄러운 환경에서도 명령을받습니다.

2.2 이하의 Google Android 버전의 경우 Android OS FroYo에 나타난 음성 액션 애플리케이션 런처를 대체하는 세 가지 애플리케이션이 있습니다. 첫째, 이들은 영어로만 작동하는 Edwin 및 Vlingo 프로그램입니다.

첫 번째는 Google 검색뿐만 아니라 Wtolfram Alpha에서 수학 공식 찾기, Twitter로 메시지 보내기 등을 제공하는 음성 명령 인식 용 고급 클라이언트입니다.

두 번째 클라이언트 (iOS, WM, S60 및 RIM BlackBerry 플랫폼에서 실행)는 Microsoft의 TellMe와 동일한 기능을 가지고 있습니다. 상태를 소셜 네트워크로 전송하고 해당 지역의 회사에 대한 경로 및 연락처 정보를 검색하는 기능도 있습니다. 마지막으로 Android 커뮤니케이터 용 TopVoiceControl이 있습니다. 주소록에서 전화를 걸고 음성 번호를 인식하는 것 외에도 무선 인터페이스를 제어하고 달력을 열 수 있습니다.

할 일 목록

음성 오거나이저는 여전히 이국적이지만 이러한 종류의 첫 번째 응용 프로그램이 이미 나타나고 있으며 인기를 얻고 있습니다. 따라서 언급 된 개발자 Speereo Software는 "Calendar"및 "Tasks", 이메일에 항목을 생성하도록 설계된 Speereo Voice Organizer 프로그램을 제공합니다. 그러나이 경우 음성은 텍스트로 변환되지 않습니다. 메시지는 첨부 된 오디오 파일로 전송되고 현재 작업에 대해 경고합니다. IOS에는 받아쓰기 된 메시지를 인식하고 텍스트 형식으로 변환하는 QuickVoice2Text 이메일 메일 클라이언트가 포함되어 있습니다.

Google Android의 경우 할일 목록에 작업을 추가하기위한 음성 애플리케이션 Taskos To Do List와 VoiceLink라는 트위터에 SMS, 편지 및 메시지를 보내는 프로그램이 출시되었습니다.

Taskos 할 일 목록 Android OS 장치에 지시하여 할 일 목록을 만듭니다.

역사 참조

최초의 음성 인식 기술은 1952 년에 등장하여 음성 번호를 자동으로 감지 할 수있게되었습니다. 1990 년대 초, 단일 단어와 구문은 물론 간단한 문장도 처리 할 수있는 솔루션이 시장에 출시되었습니다. 그들은 미국에서 흔했으며 의료 및 군대에서 사용되었습니다. 일반 소비자들 사이에서 음성 제어 시스템의 대중화는 스마트 폰의 출현과 함께 20 세기와 21 세기 초에 시작되었습니다.