A Microsoft divulgou uma lista de 15 marcos que moldaram a sua visão sobre inteligência artificial. A empresa destacou que, embora possa parecer que a inteligência artificial tenha surgido nos últimos anos como uma tecnologia completamente formada, pronta para ajudar a mudar a maneira como interagimos com o mundo ao nosso redor, a realidade é que o desenvolvimento da IA levou décadas de trabalho – e progressos iniciais em áreas como aprendizado de máquina e processamento de linguagem natural – com avanços ainda por vir.
Também reforçou o papel de Bill Gates no desenvolvimento da IA, apontando que, não há como negar que os avanços tecnológicos e as inovações que a Microsoft impulsionou nos últimos 50 anos foram passos críticos no caminho que levou à era da IA de hoje. Para explicar isso, ressaltou que, desde o lançamento do primeiro sistema operacional em 1985 até o Tidal Wave de Gates, 10 anos depois, previu o poder da internet. O superpoder da empresa sempre foi abraçar a mudança e apontar para o futuro. Isso continuou com artigos fundamentais da Microsoft Research sobre Redes Bayesianas e o provador de teoremas Z3, que abriram caminho para os desenvolvimentos da IA, diz a nota enviada à imprensa.
Confira a seguir a lista da Microsoft explorando como vários marcos importantes da companhia ajudaram a lançar as bases para onde estamos hoje e como a empresa planeja desenvolver a plataforma, ferramentas e infraestrutura de IA mais confiáveis para o futuro.
1. Bing é lançado com capacidades de linguagem natural
Evolução do Windows Live Search, o lançamento do Bing em 2009 trouxe características notáveis de aprendizado de máquina em seu início, incluindo sugestões de busca durante a digitação da consulta e uma lista de buscas relacionadas, conhecida como Painel de Exploração. Essas características aproveitaram a tecnologia semântica da Powerset, uma empresa adquirida pela Microsoft em 2008.
2. Project Oxford lança a base para a amplitude das capacidades de IA no Azure
Muitos dos avanços técnicos da Microsoft são construídos sobre o sucesso do Azure. Este projeto, lançado em 2015, forneceu aos desenvolvedores um conjunto de tecnologias inteligentes usadas para construir aplicativos mais inteligentes, com detecção facial, reconhecimento de voz e compreensão de linguagem. Agora é conhecido como Azure AI Foundry.
Muito disso remonta ao Bing, disse Eric Boyd, vice-presidente corporativo de Azure AI Platform na Microsoft, que começou sua jornada na empresa no desenvolvimento de Bing Ads. Construímos essa infraestrutura para treinar modelos de IA, como iterar e experimentar para ver qual modelo de IA estava performando melhor. Toda essa infraestrutura se transformou em peças e componentes das coisas que agora oferecemos através do Azure AI.
O número de produtos críticos que surgiram do Azure inclui o desenvolvimento de aplicativos de IA conversacional, Serviços Cognitivos da Microsoft, IA e Ética em Engenharia e Pesquisa da Microsoft (AETHER) e suas ferramentas de IA responsável de código aberto, e o Azure OpenAI Service, que combina modelos de linguagem poderosos com as capacidades empresariais do Azure. Hoje, mais de 60 mil organizações estão usando o Azure AI Foundry e 65% das empresas da Fortune 500 adotaram o Azure OpenAI Service.
3. Um novo framework aumenta o treinamento e desempenho da rede neural profunda
Um avanço da Microsoft Research, as Deep Residual Networks, também conhecidas como ResNet, foram introduzidas em 2015. A estrutura de aprendizado residual melhorou significativamente o treinamento de redes neurais profundas, permitindo o desenvolvimento de arquiteturas mais complexas com melhor desempenho. Isso abriu a porta para uma ampla gama de aplicações práticas, muitas das quais são críticas para nossas vidas hoje.
ResNet definiu o padrão para visão computacional que é usada em todo lugar, disse Peter Lee, presidente da Microsoft Research. Se você tem um carro autônomo, ele está usando IA baseada no ResNet. Se você está fazendo uma ressonância magnética na clínica, essa máquina de ressonância magnética também tem tecnologia baseada no ResNet.
4. Um salto no aprendizado multissensorial e multilíngue
Em um período de cinco anos a partir de 2015, a Microsoft atingiu a paridade de desempenho humano em vários benchmarks de reconhecimento de fala conversacional, tradução de máquina, resposta a perguntas conversacionais, compreensão de leitura de máquina e legendagem de imagem.
Esses cinco avanços foram fundamentais para produzir um salto nas capacidades de IA, alcançando aprendizado multissensorial e multilíngue que está mais em linha com a forma como os humanos aprendem e entendem. Esses avanços levaram ao desenvolvimento pela Microsoft do XYZ-code, a interseção de três atributos da cognição humana: texto monolíngue (X), sinais sensoriais de áudio ou visual (Y) e multilinguismo (Z) – e foram integrados aos serviços Azure AI para ajudar os clientes a acelerar sistemas de IA mais poderosos e integrativos.
5. Aumentando a acessibilidade ao tornar o mundo visual audível
Com o objetivo de criar tecnologia que aumenta a acessibilidade, a Microsoft introduziu o Seeing AI em 2016. Este exemplo real de IA utiliza visão computacional e processamento de linguagem natural para descrever os arredores de onde a pessoa está, ler textos, responder perguntas, identificar moedas e até mesmo descrever pessoas ao seu redor e expressões faciais.
O recurso Find My Things (Encontrar Minhas Coisas) ajuda deficientes visuais a personalizar sua experiência, ensinando a ferramenta a reconhecer os itens que elas usam e podem perder. Isso pode incluir itens pequenos como chaves de casa ou fones de ouvido.
A acessibilidade torna as ferramentas e tecnologias da Microsoft mais fáceis para todos e acelera a inovação para o mundo, incluindo produtos como o Reading Coach, que ajuda os estudantes a aprender a ler e apoia leitores emergentes e aprendizes com dislexia.
6. Mudando a velocidade do processamento de IA
2017 marcou a chegada do Brainwave: uma plataforma de aceleração de aprendizado profundo projetada para executar cargas de trabalho de IA em tempo real em escala na infraestrutura de nuvem da Microsoft. O Brainwave combina field-programmable gate arrays (FPGAs) com software de alto desempenho, aumentando significativamente o desempenho dos modelos de IA, particularmente para tarefas como reconhecimento de imagem e processamento de linguagem natural. O Brainwave marcou um salto importante na abordagem da Microsoft em hardware de IA e inferência de IA baseada na nuvem.
7. Inovação em grandes modelos de linguagem
Em 2020, a Microsoft lançou o Turing-NLG (Geração de Linguagem Natural), um dos maiores modelos de linguagem daquela época com 17 bilhões de parâmetros. Isso demonstrou a liderança da Microsoft no desenvolvimento de IA para compreensão da linguagem natural e precedeu o desenvolvimento de outros modelos fundamentais, como o Florence para reconhecimento visual.
8. Nuance apresenta a primeira solução de inteligência clínica ambiente para a saúde
O DAX Copilot, agora incorporado ao Dragon Copilot, foi um grande passo no campo da saúde, utilizando IA habilitada por voz para permitir que os clínicos documentem os encontros com os pacientes durante uma conversa natural entre o médico, paciente e famílias, permitindo que os profissionais de saúde prestem atenção total quando estão com seus pacientes e reduzindo a quantidade de trabalho após o expediente.
Em 2020, o DAX tornou-se amplamente disponível e, em 2023, o DAX Express tornou-se a primeira solução a combinar IA conversacional e ambiente com GPT-4. A solução de IA ambiental agora é adotada por mais de 600 grandes sistemas de saúde. Está produzindo mais de 3 milhões de episódios de cuidados por mês e crescendo.
9. Infraestrutura de supercomputação sem precedentes no Azure acelera avanços da OpenAI
Também em 2020, a Microsoft introduziu um novo supercomputador hospedado no Azure para OpenAI, estabelecendo uma nova infraestrutura para treinar grandes modelos de IA e um primeiro passo para torná-los disponíveis como uma plataforma. No momento de seu lançamento, comparado com outras máquinas listadas no TOP500 de supercomputadores do mundo, o supercomputador da Microsoft ficou entre os cinco primeiros. Nos anos seguintes, a Microsoft expandiu essa infraestrutura com supercomputadores de IA de escala sem precedentes para grandes avanços no desempenho de aplicações para treinamento e inferência de IA.
A parceria com a OpenAI foi formada sobre uma base de ideais compartilhados e um impulso para avançar de forma responsável o estado da arte da IA. Juntas, as duas empresas construíram uma infraestrutura de supercomputação sem precedentes no Azure para acelerar os avanços da OpenAI, e através dessa colaboração foram capazes de entender melhor não apenas como montar a melhor plataforma de IA do mundo, mas mais importante, como entregar seus benefícios para os clientes e para o mundo.
10. Abrindo a porta para uma nova maneira de escrever códigos com IA
A aquisição do GitHub pela Microsoft levou à eventual criação do GitHub Copilot em 2021. O assistente de programação com inteligência artificial, que permite aos desenvolvedores escolher entre modelos como Claude 3.5 Sonnet da Anthropic, Gemini 2.0 Flash do Google, e o o3-mini e GPT-4o do OpenAI, ajuda os desenvolvedores a escrever o código de forma mais eficiente através de trechos de código sugeridos e respostas contextualmente conscientes. Foi mais um passo para fornecer uma plataforma de IA de classe mundial para capacitar clientes, indivíduos e criadores em todos os lugares. Desde então, o GitHub Copilot tornou-se a ferramenta de programação com IA preferida por mais de 77 mil organizações em todas as regiões e indústrias, e está evoluindo rapidamente para um programador agente com recursos como modo agente e revisão de código.
11. IA reinventa a busca e inicia uma onda de inovação na vida e no trabalho
Em 2023, Bing e Edge se tornaram impulsionados por IA, ajudando a criar uma mudança sísmica na maneira como as pessoas usavam a busca. Também levou à rápida evolução e integração do Copilot em todas as soluções da Microsoft ao longo do ano seguinte. O Copilot continuou a evoluir, tornando-se não apenas uma ferramenta informativa, mas também um verdadeiro companheiro de IA com o lançamento do aplicativo Copilot para consumidores. A introdução de Voz e Visão permite que o Copilot se adapte ao usuário e forneça respostas, encorajamento e conselhos à medida que as pessoas passam pelos seus desafios cotidianos.
Após o lançamento inicial no Bing em 2023, a Microsoft rapidamente integrou o Copilot em seu portfólio de produtos. O Microsoft 365 Copilot ajudou as pessoas a serem mais produtivas, enquanto o Dynamics 365 e o Power Platform ajudaram a transformar processos empresariais.
Inovação rápida com Copilot
7 de fevereiro de 2023: Copilot no Bing
6 de março de 2023: Microsoft Dynamics 365 Copilot
16 de março de 2023: Microsoft 365 Copilot
16 de março de 2023: Copilot no Power Platform
22 de março de 2023: GitHub Copilot X
28 de março de 2023: Microsoft Security Copilot
20 de abril de 2023: Copilot no Microsoft Viva
23 de maio de 2023: Copilot no Windows
15 de janeiro de 2024: Copilot Pro
21 de maio de 2024: Ferramentas Copilot Studio para construir agentes autônomos
4 de janeiro de 2024: Tecla Copilot incluída em dispositivos Windows 11
1 de outubro de 2024: Experiência do Copilot para consumidores finais atualizada com Visão e Voz
15 de janeiro de 2025: Microsoft 365 Copilot Chat + Agents
16 de janeiro de 2025: Copilot em assinaturas pessoais e familiares do Microsoft 365
25 de março de 2025: Raciocínio profundo no Microsoft 365
12. Apresentando uma nova categoria de PCs com Windows projetados para IA
Baseado no trabalho iniciado em 2019 com a introdução do Surface Pro X, os PCs Copilot+ introduziram em 2024 uma arquitetura de sistema totalmente nova para unir o poder da CPU, GPU e uma nova Unidade de Processamento Neural (NPU) de alto desempenho. Aproveitando as capacidades da NPU, os PCs Copilot+ alcançaram um nível de desempenho nunca visto antes – até 20 vezes mais poderosos e até 100 vezes mais eficientes para executar cargas de trabalho de IA. Isso inaugurou uma gama de novas experiências de IA que eram anteriormente impossíveis, tornando as tarefas no PC mais rápidas, simples e personalizadas.
13. Um novo framework para construir agentes de IA
Lançado em 2023, o AutoGen é uma estrutura de programação de código aberto para construir agentes de IA e facilitar a cooperação entre vários agentes para resolver tarefas. O objetivo do AutoGen é fornecer uma estrutura fácil de usar e flexível para acelerar o desenvolvimento e pesquisa em IA agentiva. A resposta da comunidade de desenvolvedores ao AutoGen ajudou a definir o cenário e identificar casos de uso essenciais para as ofertas de agentes da Microsoft.
14. Pioneirismo na categoria de pequenos modelos de linguagem com Phi
Esta inovação de pesquisa para produto em 2024 foi pioneira na categoria de pequenos modelos de linguagem para desbloquear inovação de modelos personalizados e econômicos e tornar a IA acessível a mais pessoas, por exemplo, em smartphones e outros dispositivos móveis que operam na borda, e não conectados à nuvem. Desde então, a Microsoft introduziu mais iterações do Phi no catálogo de modelos do Azure AI Foundry, incluindo modelos Phi específicos para a indústria para ajudar os clientes a abordar casos de uso específicos.
15. Um modelo de IA generativo pioneiro para jogos
Um avanço na ideação de jogos, o modelo Muse, lançado em 2025, desenvolve uma compreensão profunda do ambiente, incluindo sua dinâmica e como ele evolui ao longo do tempo em resposta às ações. As capacidades do ChatGPT e do GPT-4 de aprender a linguagem humana agora são correspondidas pela capacidade da IA de aprender a mecânica de como as coisas funcionam, desenvolvendo efetivamente uma compreensão prática das interações no mundo. Isso desbloqueia a capacidade de iterar rapidamente, remixar e criar em videogames, para que os desenvolvedores possam eventualmente criar ambientes imersivos e liberar toda a sua criatividade.