Sobre LLM/AI e seu impacto na UI/UX

May 01 2023
Por quase 50 anos, desde a época dos Laboratórios Xerox, engenheiros e cientistas, tem havido um esforço contínuo para desenvolver uma coleção de padrões e um campo formal de estudo para interação humano-computador. À medida que os computadores, programas e dispositivos evoluíram tremendamente, também houve a necessidade de os profissionais de experiência do usuário criarem novos conceitos e metáforas para que os usuários finais tenham uma experiência agradável.
Criado com MidjourneyAI

Por quase 50 anos, desde a época dos Laboratórios Xerox, engenheiros e cientistas, tem havido um esforço contínuo para desenvolver uma coleção de padrões e um campo formal de estudo para interação humano-computador.

À medida que os computadores, programas e dispositivos evoluíram tremendamente, também houve a necessidade de os profissionais de experiência do usuário criarem novos conceitos e metáforas para que os usuários finais tenham uma experiência agradável.

Nós, como indústria, criamos uma montanha de ferramentas, bibliotecas e estruturas que abstraem a complexidade e o constrangimento para apresentar ao usuário uma interface intuitiva e fácil de usar. Adotamos conceitos da psicologia, desenvolvimento humano e ciência cognitiva para nos ajudar a entender melhor nossos usuários e como eles usam qualquer dispositivo, aplicativo da web ou até mesmo interfaces de programação.

Todas essas coisas estão enraizadas no fato de que os humanos não falam binário ou hexadecimal e o computador não fala em linguagem humana. Então, primeiro precisávamos de uma forma gráfica de interagir com o computador, porque a interação de linha de comando é altamente não intuitiva e requer conhecimento prévio do sistema. Então os engenheiros inventaram a IU, depois o mouse e assim por diante. Mas, à medida que os computadores ganharam poder e capacidade, novos padrões, novos comportamentos e até mesmo paletas de cores tiveram que ser implementados.

Criado com MidjourneyAI

Nos últimos 15 anos, pelo menos para aplicativos da web, a maior parte do esforço se concentrou em tornar os fluxos de trabalho CRUD utilizáveis, intuitivos e acessíveis. Mas muito parecido com antes, porque não se pode esperar que o usuário seja especialista em SQL, conheça o esquema do banco de dados, nomes de campo etc. para recuperar as informações necessárias. Há também a necessidade de painéis de “painel único” para unificar, pelo menos no que diz respeito ao usuário, fontes de dados díspares de maneira coerente e coesa.

[Gravar som de arranhão]

Com os desenvolvimentos recentes em LLMs e AIs, muitas das necessidades subjacentes para UIs e seu UX são negadas, na minha opinião. Projetos como ChatGPT, Bard, Bing (e todos os descendentes atuais de terceiros) demonstram que atingimos um ponto na tecnologia em que os computadores entendem e se comunicam com os humanos com facilidade. Como usuário, não preciso de três botões, um menu suspenso e uma caixa de pesquisa, posso apenas digitar em linguagem natural o que estou procurando, o que pode ser uma operação incrivelmente complexa nos bastidores, e o sistema entende o consulta, analisa-a internamente, faz inferências e retorna o que acredita ser a resposta mais precisa. Não preciso saber a sintaxe exata, sinalizadores, bancos de dados, etc.

Como usuário, posso digitar “criar projeto Overlord, adicionar-me como proprietário, adicionar três novas tarefas a ele: reunir inteligência, discutir com aliados, implementar” e o sistema sabe o que fazer. “listar todos os projetos dos quais faço parte, classificados por data de vencimento mais cedo primeiro” e eu poderia entrar na complexidade que quisesse e o sistema saberia o que fazer.

Por não exigir nenhuma habilidade especial ou conhecimento do sistema, os sistemas baseados em prompt eliminam a necessidade de muito do que foi construído e projetado nas últimas duas décadas em termos de UI e UX. No entanto, vai além, porque o MLL/AI baseado em prompt depende do uso da linguagem escrita natural, é a interface mais acessível (no sentido a11y) que existe. E para aqueles com deficiências de movimento, uma ferramenta de voz para texto funcionará. Chega de dores de ordem de tabulação, sem mais problemas ou aria-preocupações com contraste. Linguagem natural entrando, linguagem natural saindo.

Claramente, nem todos os dados e informações podem ser descritos textualmente. A necessidade de gráficos, grades, listas etc. permanecerá. Mas graças a todo o trabalho ao longo dos anos, este é um “problema resolvido”. Temos widgets, componentes, etc. que o sistema pode aproveitar. Aposto que em 3 a 5 anos, a maioria dos aplicativos da web, inteligência de negócios, análises, aplicativos se parecerão com um Jupyter Notebook (aumentado como Google Colab , Noteable , por exemplo). Mas é muito cedo para dizer.

Para encerrar, a última geração de MLLs e AIs está trazendo muitas promessas, mas também muito potencial para ruptura e deslocamento. Não tenho uma bola de cristal, então não posso ver o que vai acontecer daqui a 3 a 5 anos, mas acredito que muitas disciplinas em tecnologia e campos adjacentes a ela terão um ajuste de contas, incluindo o campo de UI/UX.