sobregrupos de trabalhoeventos
publicações
notíciasrevistaswhitepaperscanal abranetmídia
contato
  • Fone (11) 3078-3866
  • WhatsApp +55 11 94528-2739
  • E-mail sec@abranet.org.br
Rua MMDC, 450, cj 304, Butantã, São Paulo-SP, 05510-000
Conheça nosso podcast Pensai!
#005 - Marketing e IA: conversa com Thiago Gonçalves, Country Manager da Blip México
#005 - Marketing e IA: conversa com Thiago Gonçalves, Country Manager ...
01h00/30 abr 2025
/
YouTubeSpotifyInstagram
Copyright © 2014 - 2025
Abranet - Associação Brasileira de Internet
Produzido e gerenciado por Editora Convergência Digital / Site criado pela SENNO
  1. home
  2. publicações
  3. notícias
  4. O que seu chatbot ainda não consegue fazer (e talvez nunca consiga)

O que seu chatbot ainda não consegue fazer (e talvez nunca consiga)

16 de junho de 2025

por Redação The Shift

O que seu chatbot ainda não consegue fazer (e talvez nunca consiga)

A OCDE (Organização para a Cooperação e Desenvolvimento Econômico) está desenvolvendo um conjunto de indicadores para descrever o que a IA pode e não pode fazer em relação a diferentes áreas do desempenho humano. O conjunto completo não será divulgado antes do final de junho. Mas o primeiro rascunho ficou pronto.

Os indicadores são: Linguagem; Interação Social; Resolução de Problemas; Criatividade; Metacognição e Pensamento Crítico; Conhecimento, Aprendizagem e Memória; Visão; Manipulação; e Inteligência Robótica. E medem o desenvolvimento da IA a partir de uma escala de cinco níveis, em que as capacidades mais desafiadoras para sistemas de IA estão no topo. Cada nível inclui uma breve descrição dos tipos de capacidades que os sistemas de IA naquele nível podem executar com precisão e consistência, desde o passado até um futuro hipotético em que a IA possa reproduzir todos os aspectos humanos de cada capacidade.

Para ser classificado em um determinado nível, um sistema de IA deve possuir de forma consistente e confiável a maioria dos aspectos da capacidade descrita naquele nível. Por exemplo, os LLMs foram classificados no limiar entre os níveis 2 e 3 na escala de Linguagem. Possuem muitos aspectos da capacidade linguística descritos no nível 3, mas são prejudicados por sua incapacidade de se envolver em raciocínio analítico bem estruturado, sua tendência a “alucinar” e gerar informações incorretas e sua incapacidade de aprender dinamicamente.

A escala de Conhecimento, Aprendizagem e Memória observa que as alucinações serão corrigidas no nível 5. A escala de Linguagem também observa que o Pensamento Crítico aparecerá no nível 5, e a escala de Metacognição e Pensamento Crítico observa que a avaliação crítica do Conhecimento aparecerá no nível 3. Essa diversidade entre as escalas destaca algumas perspectivas diferentes na antecipação da dificuldade relativa de corrigir esse desafio. Um aspecto das escalas que certamente precisará ser harmonizado em versões futuras dos indicadores, sempre lembrando que uma função importante das escalas é lembrar ao público que a alucinação aparece como um desafio entre muitos: vários desafios precisam ser resolvidos para que a IA atinja o desempenho de nível humano.

A intenção da OCDE é de que esses indicadores balizem os debates sobre as implicações da IA para o futuro da Educação – da concepção curricular à Pedagogia. Na opinião de técnicos do projeto “IA e o Futuro das Competências (AIFS)”, do Centro de Pesquisa e Inovação Educacional (CERI) da OCDE, esses indicadores podem ser usados para compreender melhor as implicações da IA para a educação. E fornecer uma estrutura para identificar onde os sistemas de IA podem possibilitar mudanças transformadoras na educação, ajudando a esclarecer quais tarefas de ensino podem ser reformuladas e quais objetivos de aprendizagem precisarão evoluir.

Em linhas gerais, os indicadores:

  • Destacam áreas em que mudanças na oferta e no propósito da educação são tecnicamente viáveis, subsidiando discussões futuras sobre currículo, papéis dos professores e competências dos alunos. 
     
  • Ajudam a mapear os requisitos ocupacionais e a analisar como ocupações específicas podem evoluir, uma vez que a IA se torne capaz de auxiliar ou substituir trabalhadores em algumas tarefas.

A esperança da OCDE é que, ao vincular o desempenho da IA às demandas do trabalho no mundo real e aos objetivos educacionais, os indicadores possam:

  • nos ajudar a ver onde podem ocorrer grandes mudanças e onde as funções humanas continuarão sendo essenciais. 
     
  • fornecer um sinalizador valioso aos pesquisadores de IA dos recursos que precisarão ser testados, a fim de fornecer avaliações informativas do progresso da IA, à medida que as limitações das abordagens atuais de benchmarks se tornam cada vez mais evidentes. 
     
  • oferecer um mecanismo por meio do qual os os formuladores de políticas possam se comunicar com os pesquisadores de IA sobre os tipos de recursos que precisam ser avaliados para atender às preocupações sociais, políticas e éticas relacionadas ao desenvolvimento da tecnologia.

Em resumo, a OCDE acaba de entregar algo de que precisávamos: um sistema GPS adequado para as capacidades da IA. Sua proposta de Indicadores de Capacidade de IA representa a tentativa mais abrangente até o momento de criar uma estrutura padronizada para entender o que a IA realmente pode fazer em comparação com as capacidades humanas. Mais de 50 especialistas em Ciência da Computação e Psicologia passaram cinco anos desenvolvendo essa estrutura, combinando pesquisa acadêmica rigorosa com aplicações práticas e reais. Vale dar um boa olhada no trabalho.

Para líderes corporativos, a OCDE oferece algo realmente valioso: uma verificação da realidade que transcende o discurso de marketing de fornecedores. Quando um representante de vendas promete que sua solução de IA “vai revolucionar suas operações”, agora você pode fazer perguntas específicas sobre quais níveis de capacidade o sistema realmente alcança e em quais domínios específicos.

A análise da lacuna entre as capacidades atuais da IA e os requisitos de tarefas empresariais específicas torna-se mais clara quando se estabelecem benchmarks padronizados. Considere o Atendimento ao Cliente, em que as empresas estão implantando chatbots de IA com o entusiasmo de garimpeiros da corrida do ouro. A estrutura da OCDE sugere que, embora a IA possa lidar razoavelmente bem com interações estruturadas, qualquer coisa que exija inteligência social genuína, resolução de problemas com nuances ou pensamento criativo expõe rapidamente as limitações atuais.

 


Conteúdo originalmente produzido e publicado por The Shift. Reprodução autorizada exclusivamente para a Abranet. A reprodução por terceiros, parcial ou integral, não é permitida sem autorização.

leia

também

  • Drex, a moeda digital nacional, teve 500 operações de 11 instituições em 50 dias de piloto

    Drex, a moeda digital nacional, teve 500 operações de 11 instituições em 50 dias de piloto

    13 de setembro de 2023 | Redação da Abranet

    O Banco Central (BC) informou que, em 50 dias de projeto piloto, 500 transações foram bem sucedidas no Drex, a moeda digital brasileira, e 11 instituições operam na rede. Segundo a autoridade monetária, os participantes do programa começaram a ser incorporados à plataforma no fim de julho. De lá para cá, vários tipos de operações têm sido simuladas, tanto no atacado quanto no varejo, disse o BC. De acordo com a autarquia, a primeira emissão de títulos públicos federais na plataforma Drex para fins de simulação foi realizada nessa segunda-feira (11). Cada um dos participantes já habilitados recebeu uma cota da versão para simulação dos títulos públicos e, a partir de então, podem iniciar também a simulação de procedimentos de compra e venda desses títulos entre eles e entres clientes simulados, afirmou. Vários tipos de operações têm sido simuladas tanto no atacado quanto no varejo – como criação de carteiras, emissão e destruição de Drex e transferências simuladas entre bancos e entre clientes. Todos os participantes conectados já realizaram ao menos alguns desses tipos de transações, sendo que cerca de 500 operações foram conduzidas com sucesso. A primeira fase do piloto deve ser encerrada no meio de 2024, com o desenvolvimento ainda de outras facilidades na fase seguinte. A cada semana, um tipo novo de operação é realizado pelas instituições participantes. Todas essas transações são apenas simuladas e se destinam ao teste de infraestrutura básica do Drex, que ainda não conta com a soluções de proteção à privacidade que serão testadas ao longo do Piloto Drex, ressaltou o BC.

    ler mais
  • BC publica cronograma para testes do Pix Automático

    BC publica cronograma para testes do Pix Automático

    04 de setembro de 2024 | Da Redação Abranet

    O Departamento de Competição e de Estrutura do Mercado Financeiro do Banco Central publicou nesta quarta, 4/9, uma nova instrução normativa que trata de diferentes aspectos da adesão ao Pix, além de prever a oferta de produtos e serviços adicionais ou facultativos. A norma trata de como os interessados, tenham já ou não autorização do BC para operar, devem fazer para aderirem ao sistema de pagamento instantâneo, as diversas etapas do processo e exigências para a formalização, como o projeto de experiencia do usuário, uso de QR Codes, etc. A autoridade monetária também trata de como instituições autorizadas a funcionar podem oferecer serviços adicionais, se habilitar ao Diretório de Identificadores de Contas Transacionais – DICT, ou serviços de iniciação de pagamentos, saque, por exemplo. Prevê, ainda, que uma instituição já participante do Pix, ou em processo de adesão, poderá apresentar, a qualquer tempo, pedido para ofertar ou consumir funcionalidades, de natureza facultativa, relacionadas ao Pix Automático. Além disso, a IN 511 traz um cronograma relacionado aos testes do Pix Automático: I – instituições que concluíram a etapa homologatória do processo de adesão ao Pix antes de 28 de abril de 2025, inclusive instituições participantes em operação, devem realizar com sucesso os testes entre 28 de abril de 2025 e 6 de junho de 2025; II – instituições que concluíram a etapa homologatória do processo de adesão ao Pix entre 28 de abril de 2025 e 6 de junho de 2025 devem realizar com sucesso os testes no prazo de oito semanas contadas a partir da conclusão com sucesso da etapa homologatória pertinente; III – instituições que não concluírem a etapa homologatória do processo de adesão ao Pix até 6 de junho de 2025 devem concluir os testes do Pix Automático dentro do prazo determinado para a conclusão com sucesso dessa etapa; e IV – instituições participantes em operação que ofertem conta apenas a usuários pessoa jurídica e optem por não ofertar pagamentos via Pix Automático devem encaminhar formulário cadastral indicando dispensa da oferta de Pix Automático até 4 de abril de 2025. Instituições participantes do Pix que estejam obrigadas a ofertar serviços do Pix Automático ou que, de forma facultativa, enviem até 4 de abril de 2025 formulário de atualização cadastral indicando a intenção de oferta de serviços do Pix Automático, devem cumprir os testes entre 28 de abril de 2025 e 6 de junho de 2025.

    ler mais
  • Comitê que vai definir futuro da internet tem dois brasileiros

    Comitê que vai definir futuro da internet tem dois brasileiros

    15 de julho de 2014 | Roberta Prescott

    Passado o evento NetMundial, agora representantes de grupos setoriais trabalham juntos para formar comitê que vai elaborar uma proposta para nortear a migração dos trabalhos da Iana, sigla em inglês para Autoridade para Designação de Números da Internet, para, ao que tudo indica, uma entidade multissetorial.; A IANA é um departamento da ICANN (em português, Corporação da Internet para Atribuição de Nomes e Números), cujo controle, até agora, é exercido pela NTIA, agência dos EUA responsável por aconselhar o presidente nos assuntos envolvendo políticas de telecomunicações e de informação.; O atual contrato do governo dos Estados Unidos com a ICANN para gerenciar as funções técnicas de DNS expira em 30 de setembro de 2015, podendo ser estendido por até quatro anos, se a comunidade precisar de mais tempo para desenvolver a proposta de transição. Desde que os Estados Unidos anunciaram sua saída, entidades do mundo todo vêm se organizando para debater como será a feita a transição e quem ficará na coordenação.; Durante o NetMundial, realizado entre 23 e 24 de abril, em São Paulo, o governo dos Estados Unidos se opôs a um modelo multilateral, apontando, entre as condicionantes para a transição, que apoiam o modelo multissetorial (multistakeholder). Os EUA também deixaram claro que não vão aceitar uma proposta de transição que substitua o papel NTIA com uma solução conduzida por algum governo ou uma solução intergovernamental.; O NetMundial foi aclamado por seus participantes por indicar uma série de princípios que devem reger a internet, como a neutralidade de rede, a liberdade de expressão e o direito de acesso. A consolidação destes princípios foi o grande legado, como explicou para a Abranet Vanda Scartezini, representante para a América Latina da ONG PIR. ; ; Cada um dos grupos dos stakeholders, líderes dos principais setores da cada sociedade interessados no tema, elege os participantes que integrarão o comitê, sempre visando ao caráter técnico e não político. No total, cerca de 30 pessoas integrarão o comitê de trabalho cujo objetivo é apresentar uma proposta do que poderia substituir o controle que hoje é da NTIA. Dois brasileiros fazem parte deste comitê: Demi Getschko, do Núcleo de Informação e Coordenação do Ponto BR (NIC.br), e Hartmut Richard Glaser, secretário-executivo do Comitê Gestor da Internet no Brasil – CGI.br.; A expectativa, explica Vanda Scartezini, é ter alguma proposta no próximo encontro da ICANN, em outubro em Los Angeles. Despois disto, as ideias vão para consulta pública, quando recebem críticas e sugestões, que são compiladas e analisadas. “Esta é a primeira fase de trabalhos. Como é um grupo grande, imagino que eles devam se dividir em subgrupos”, comenta. ; ;

    ler mais