O Toque Humano: A Busca da IA por Dados de Qualidade

Empresas de Inteligência Artificial (IA) estão se envolvendo proativamente com humanos para melhorar seus modelos de linguagem, como revelado pelo The New York Times. Essas entidades estão em busca de dados de qualidade e algumas optaram por empregar trabalhadores autônomos (gig workers) que contribuem com materiais textuais bem elaborados para o desenvolvimento de IA. A busca por dados de alta qualidade pelas empresas de IA está se tornando mais evidente, com iniciativas como a liderança da Meta contemplando a aquisição da editora Simon & Schuster, visando obter direitos a um repositório de conteúdo mais rico para treinar seus modelos de IA.

Além disso, há um aumento no número de empresas que oferecem dados de treinamento de qualidade, incluindo novos empreendimentos como Scale AI e Surge AI. Essas empresas frequentemente contratam estudantes universitários e recém-formados para escrever ensaios em suas áreas de especialização. Embora a ideia de utilizar textos gerados pela IA generativa em si tenha sido considerada, existem preocupações de que essa prática possa comprometer a qualidade de novos modelos.

As cadeias de suprimentos para os dados de treinamento necessários estão se expandindo, não apenas por meio de recrutamento direto, mas também por outras fontes de emprego e economia autônoma. Por exemplo, a Cohere, sediada em Toronto, recruta anotadores de dados como parte de sua força de trabalho.

Embora esse trabalho autônomo ofereça uma fonte flexível de renda, especialmente para os altamente educados, sua estabilidade pode ser efêmera. Muitos trabalhadores autônomos dependem muito dessa renda e seus contratos podem ser encerrados repentinamente, sem muitas explicações. Um exemplo destacado pelo The New York Times é o caso de Ese Agboh, um estudante nos Estados Unidos, cujo trabalho cessou sem justificativa clara, deixando Agboh especulando que sua atividade de viagem possa ter sido um fator contribuinte.

Tendências Atuais do Mercado:

A tendência de utilizar conteúdo gerado por humanos para melhorar os modelos de linguagem de IA está sendo acompanhada por avanços rápidos em tecnologias de aprendizado de máquina e processamento de linguagem natural (PLN). Isso tem levado a uma demanda crescente por dados detalhados e de qualidade para ajustar esses modelos. Mais empresas estão explorando maneiras criativas de obter esses dados, seja por meio de parcerias com instituições educacionais, contratando escritores autônomos, adquirindo empresas ricas em conteúdo ou envolvendo diretamente trabalhadores autônomos.

Além disso, há uma mudança significativa em direção à IA ética, onde as empresas estão prestando mais atenção às fontes de seus dados de treinamento, visando evitar modelos enviesados que poderiam resultar de conjuntos de dados de baixa qualidade ou não representativos. A transparência nas operações de IA, incluindo a origem dos dados e o treinamento do modelo, está se tornando cada vez mais exigida tanto pelos clientes quanto pelos órgãos reguladores.

Previsões:

Os analistas preveem que o mercado de dados de treinamento de IA continuará a crescer. A Grand View Research projetou que o tamanho do mercado global de inteligência artificial deve atingir US$ 997,77 bilhões até 2028, crescendo a uma CAGR de 40,2% de 2021 a 2028. À medida que os modelos de aprendizado de máquina se tornam mais sofisticados, a necessidade de conjuntos de dados variados e de alta qualidade se intensificará. Isso provavelmente resultará na expansão da economia autônoma para provisão de dados de IA e na criação de funções mais especializadas para curadoria e anotação de dados.

Principais Desafios e Controvérsias:

Um dos desafios centrais para as empresas de IA é encontrar um equilíbrio entre a necessidade de dados diversos e de alta qualidade e as considerações éticas relacionadas ao trabalho autônomo. Preocupações sobre pagamento justo, segurança no emprego e o potencial de exploração estão em destaque. Como mencionado, casos como a rescisão abrupta do contrato de Agboh sem razão clara destacam problemas associados à imprevisibilidade do trabalho autônomo.

Além disso, há o desafio da privacidade e consentimento de dados, especialmente ao lidar com grandes conjuntos de dados que podem incluir informações sensíveis. As empresas precisam navegar por paisagens legais e éticas complexas para garantir que os dados que utilizam não infrinjam os direitos de privacidade individuais.

Há também um debate em andamento sobre o quanto a IA deve depender de conteúdo gerado por humanos. Depender demais de textos gerados por IA pode criar ciclos de feedback que reforçam preconceitos ou erros nos modelos.

Vantagens e Desvantagens:

A vantagem de incorporar o toque humano nos dados de IA é a melhoria da compreensão do modelo sobre linguagem, contexto e nuances culturais, resultando em saídas mais precisas e confiáveis. Isso pode levar a melhores experiências do usuário em diversas aplicações de IA, como assistentes virtuais, serviços de tradução e ferramentas de moderação de conteúdo.

No entanto, esses benefícios vêm com compensações. A dependência do trabalho humano expõe os processos de treinamento de IA a preconceitos humanos, potencialmente levando a modelos de IA que perpetuem estereótipos ou imprecisões. A confiança em trabalhadores autônomos levanta questões sobre direitos trabalhistas na economia digital, já que esses empregos frequentemente carecem das proteções associadas ao emprego tradicional.

Links Relacionados:

Para os leitores interessados em pesquisas de mercado de IA mais amplas, o seguinte link é útil:
Grand View Research

Para insights sobre desenvolvimentos éticos em IA:
AIESEC

Empresas como a Cohere:
Cohere AI

Plataformas da economia autônoma são significativas na obtenção de conjuntos de dados gerados por humanos, uma dessas plataformas é:
Upwork

Por favor, observe que estas informações são baseadas no estado da IA e nas tendências de mercado até o início de 2023 e podem mudar com os avanços tecnológicos ou mudanças nas dinâmicas de mercado.

The source of the article is from the blog papodemusica.com

Privacy policy
Contact