Alto-falante inteligente

alto-falante com recursos ou serviços que vão além da reprodução de áudio

Um alto-falante inteligente é um tipo de alto-falante e dispositivo de comando de voz com um assistente virtual integrado que oferece ações interativas e ativação de as mãos livres com a ajuda de uma "palavra-chave" (ou várias "palavras-chave"). Alguns alto-falantes inteligentes também podem atuar como um dispositivo inteligente que utiliza Wi-Fi, Bluetooth e outros padrões de protocolo para estender o uso além da reprodução de áudio, como para controlar dispositivos de automação residencial. Isso pode incluir, mas não está limitado a recursos como compatibilidade entre vários serviços e plataformas, conexão peer-to-peer por meio de redes mesh, assistentes virtuais e outros. Cada um pode ter sua própria interface designada e recursos internos, geralmente lançados ou controlados por meio de aplicativo ou software de automação residencial.[1] Alguns alto-falantes inteligentes também incluem uma tela para mostrar ao usuário uma resposta visual.

Um alto-falante inteligente com tela sensível ao toque é conhecido como display inteligente. [2] [3] É um dispositivo Bluetooth inteligente que integra interface de usuário de conversação com telas de exibição para aumentar a interação de voz com imagens e vídeo. Eles são acionados por um dos assistentes de voz comuns e oferecem controles para dispositivos domésticos inteligentes, aplicativos de streaming de recursos e navegadores da web com controles de toque para seleção de conteúdo. Os primeiros displays inteligentes foram introduzidos em 2017 pela Amazon (Amazon Echo Show e Amazon Echo Spot).

Precisão

editar

De acordo com um estudo da Proceedings of the National Academy of Sciences dos Estados Unidos da América, lançado em março de 2020, as seis maiores empresas de desenvolvimento de tecnologia, Amazon, Apple, Google, Yandex, IBM e Microsoft, identificaram erroneamente mais palavras faladas por " negros" do que "pessoas brancas". Os sistemas testaram erros e ilegibilidade, com uma discrepância de 19 e 35 por cento para o primeiro e discrepância de 2 e 20 por cento para o último.[4]

O capítulo norte-americano da Association for Computational Linguistics (NAACL) também identificou uma discrepância entre as vozes masculinas e femininas. De acordo com a pesquisa, o software de reconhecimento de voz do Google é 13% mais preciso para homens do que para mulheres. Ele tem um desempenho melhor do que os sistemas usados pelo Bing, AT&T e IBM.[5]

Preocupações com a privacidade

editar

O microfone embutido nos alto-falantes inteligentes está continuamente ouvindo as "palavras-chave" seguidas por um comando. No entanto, esses microfones de escuta contínua também levantam questões de privacidade entre os usuários.[6] Isso inclui o que está sendo gravado, como os dados serão usados, como serão protegidos e se serão usados para publicidade invasiva.[7][8] Além disso, uma análise do Amazon Alexa Echo Dots mostrou que 30-38% das "gravações de áudio espúrias eram conversas humanas", sugerindo que esses dispositivos capturam áudio fora de estritamente após a detecção da palavra-chave.[9]

Como grampo telefônico

editar

Há grandes preocupações de que o microfone sempre ativo dos alto-falantes inteligentes seja um candidato perfeito para escuta telefônica. Em 2017, o pesquisador de segurança britânico Mark Barnes mostrou que os Echos anteriores a 2017 tinham pinos expostos que permitem que um sistema operacional comprometido seja inicializado.[10]

Assistência de voz x privacidade

editar

Embora os assistentes de voz forneçam um serviço valioso, pode haver alguma hesitação em usá-los em vários contextos sociais, como em público ou perto de outros usuários.[11] No entanto, apenas mais recentemente os usuários começaram a interagir com assistentes de voz por meio de uma interação com alto-falantes inteligentes, em vez de uma interação com o telefone. No telefone, a maioria dos assistentes de voz tem a opção de ser engajada por um botão físico (por exemplo, Siri com um toque longo do botão home) em vez de apenas por meio de engajamento baseado em palavras-chave em um alto-falante inteligente. Embora essa distinção aumente a privacidade, limitando quando o microfone está ligado, os usuários sentiram que ter que pressionar um botão primeiro removeu a conveniência da interação de voz.[12] Essa compensação não é exclusiva dos assistentes de voz; À medida que mais e mais dispositivos ficam online, há uma troca cada vez maior entre conveniência e privacidade.[13]

Fatores que influenciam a adoção

editar

Embora existam muitos fatores que influenciam a adoção de alto-falantes inteligentes, especificamente com relação à privacidade, Lau et. al. define cinco categorias distintas como prós e contras: conveniência, identidade como um dos primeiros a adotar, fatores contribuintes, falta de utilidade, privacidade e preocupações de segurança. [6]

Preocupações com segurança

editar

Quando configurados sem autenticação, os alto-falantes inteligentes podem ser ativados por pessoas que não sejam o usuário ou proprietário pretendido. Por exemplo, os visitantes de uma casa ou escritório, ou pessoas em uma área de acesso público fora de uma janela aberta, parede parcial ou cerca de segurança, podem ser ouvidos por alguém que esteja falando. Uma equipe demonstrou a capacidade de estimular os microfones de alto-falantes inteligentes e smartphones através de uma janela fechada, de outro prédio do outro lado da rua, usando um laser.[14]

Dispositivos e plataformas de alto-falantes inteligentes mais populares

editar
Assistente virtual Propriedade de Dispositivos No. de usuários Idiomas (dialetos) Notas
Alice Yandex
  • Estação Yandex
  • Yandex Station Mini
  • Irbis A
  • LG Xboom AI ThinQ WK7Y
  • ELARI SmartBeat
  • Prestigio Smartmate Маяк Edition
30 milhões de dispositivos Yandex no CIS (janeiro de 2019) Russo Yandex Station foi colocado à venda em julho de 2018
AliGenie Alibaba Group
  • Tmall Genie
Chinês Foi colocado à venda em agosto de 2017
Amazon Alexa Amazonas 31 milhões de dispositivos Echo nos EUA (janeiro de 2018) Verão de 2019: Inglês (EUA, Reino Unido, Irlanda, Canadá e Austrália); Francês (França e Canadá); Alemão; Italiano; Japonês; Português (brasileiro) e espanhol (Espanha e México) [15] [16] [17]
Siri Apple, Inc. Apple HomePod Verão de 2019: árabe, chinês (cantonês e mandarim), dinamarquês, holandês, inglês, finlandês, francês, alemão, hebraico, italiano, japonês, coreano, malaio, norueguês, português, russo, espanhol, sueco, tailandês e turco
DuerOS Open Platform Baidu Xiaoyu, RavenH, Aladdin alto-falante-lâmpada-projetor montado no teto [18] [19] Chinês Xiaoyu foi colocado à venda na primavera de 2017. [20]
Clova Naver Corporation, Line Corporation
  • Onda
  • Amigos
Japonês e coreano Introduzido no verão de 2017 [21]
Google Assistant Google Google Casa série : Home, Home Max, Home Mini, Nest Hub, Nest Hub Max 14 milhões de Google Homes nos EUA (janeiro de 2018) [22] Verão de 2019: dinamarquês, holandês, inglês (EUA, Reino Unido, Canadá, Austrália, Índia e Cingapura), francês (França e Canadá), alemão (Áustria e Alemanha), hindi, italiano, japonês, coreano, norueguês, português (brasileiro), Espanhol (Espanha e México) e sueco [23]
Beijing LingLong, parte do JD DingDong Mandarim e Cantonês para a Grande China Em cooperação com a empresa chinesa de IA iFlytek . Foi colocado à venda em novembro de 2016. [24]
Marusia Enviar. Grupo Ru Capsula Russo
Microsoft Cortana Microsoft Harman Kardon INVOKE Outubro de 2019: Inglês (EUA, Reino Unido, Canadá, Austrália e Índia); Chinês simplificado); Francês; Alemão; Italiano; Japonês; Português (Brasil); Espanhol (Espanha e México) [25]
Safety Labs Sirona Safety Labs Inc Sirona. televisão Inglês (EUA, Reino Unido, Canadá, Austrália e Índia);
Xiaowei Tencent Next Chinês
Bixby Samsung Electronics Galaxy Home [26]
Hallo Magenta Deutsche Telekom Hallo Magenta Alemão

Referências

  1. smart speaker, techtarget.com, Maio de 2017
  2. Brown, Rich. «Echo Show, Nest Hub, Facebook Portal and more: How to pick the best smart display in 2019». CNET. Consultado em 19 de junho de 2019 
  3. Faulkner, Cameron (9 de outubro de 2018). «How Google's new Home Hub compares to the Echo Show and Facebook Portal». The Verge. Consultado em 19 de junho de 2019 
  4. Metz, Cade (23 de março de 2020). «There Is a Racial Divide in Speech-Recognition Systems, Researchers Say». The New York Times (em inglês). Consultado em 22 de abril de 2020 
  5. Bajorek, Joan Palmiter (10 de maio de 2019). «Voice Recognition Still Has Significant Race and Gender Biases». Harvard Business Review. Consultado em 24 de abril de 2020 
  6. a b Lau, Josephine; Zimmerman, Benjamin; Schaub, Florian (1 de novembro de 2018). «Alexa, Are You Listening?: Privacy Perceptions, Concerns and Privacy-seeking Behaviors with Smart Speakers». Proc. ACM Hum.-Comput. Interact. 2: 102:1–102:31. doi:10.1145/3274371 
  7. «Amazon hands over Echo 'murder' data». 7 de março de 2017. Consultado em 2 de março de 2019 – via www.BBC.com 
  8. «Amazon patents 'voice-sniffing' algorithms». 11 de abril de 2018. Consultado em 2 de março de 2019 – via www.BBC.com 
  9. Ford, Marcia, and William Palmer.
  10. Greenberg, Andy (1 de agosto de 2017). «A Hacker Turned an Amazon Echo Into a 'Wiretap'». Consultado em 2 de março de 2019 – via www.wired.com 
  11. Sarah Mennicken and Elaine M. Huang. 2012.
  12. Christoffer Lambertsson. 2017.
  13. Rao, Sonia (12 de setembro de 2018) "In today's homes, consumers are willing to sacrifice privacy for convenience".
  14. Lasers can silently issue 'voice commands' to your smart speakers
  15. «AVS for International». developer.amazon.com. Amazon. Consultado em 19 de março de 2018 
  16. «THE YEAR ALEXA GREW UP». www.wired.com. Wired. Consultado em 23 de dezembro de 2018 
  17. «Language Support in Voice Assistants Compared». Globalme. Consultado em 28 de janeiro de 2020 
  18. «Baidu launches three new smart speakers that don't need Alexa or Google Assistant» 
  19. Bonnington, Christina (16 de novembro de 2017). «Baidu's New Smart Speaker Looks Like Nothing Else on the Market» – via Slate 
  20. Horwitz, Josh. «China's tech giants are racing to popularize their versions of the Amazon Echo» 
  21. «LINE to Introduce Clova Virtual Assistant for Korea and Japan - Voicebot». www.voicebot.ai 
  22. Bishop, Todd (26 de janeiro de 2018). «New data: Google Home faring better against Amazon Echo, grabbing 40% of U.S. holiday sales». GeekWire. Consultado em 29 de novembro de 2019 
  23. «Change your Google Assistant language». Google Home Help. Consultado em 19 de março de 2018 
  24. Bateman, Joshua D. (22 de novembro de 2016). «Behold China's Answer to Amazon Echo: The LingLong DingDong». Wired. Condé Nast. Consultado em 25 de novembro de 2017 
  25. «Cortana's regions and languages». support.microsoft.com. Consultado em 28 de janeiro de 2020 
  26. Ingraham, Nathan (9 de agosto de 2018). «Does Samsung's Galaxy Home stand a chance?». Engadget. Oath Inc. Consultado em 9 de agosto de 2018