El Deep Learning necesita 100.000 ejemplos para funcionar y ayuda de humanos

Los anhelos por crear inteligencias artificiales, por concebir sistemas con capacidades de discernimiento similares a las de la mente humana, son una constante desde mediados del pasado siglo. Y no es ciencia ficción, es una realidad cada vez más posible.

Sin embargo, tanto en el campo de las inteligencias artificiales como en el del aprendizaje automático y más concretamente en el del aprendizaje profundo, el conocido Deep Learning, se necesitan muchos conocimientos y ayuda humana. Gran cantidad de datos, en ocasiones organizados por humanos. Pero, ¿cuántos? Como mínimo 100.000.

Esa es la cifra que ha dado Jeff Dean, Google Senior Fellow y líder de Google Brain, en una charla en el escenario del VB Summit 2017 en Berkeley, California.

Si solo tienes diez ejemplos de algo, va a ser difícil hacer que el Deep Learning funcione. Si tienes 100.000 cosas que te interesan, registros o lo que sea, ese es el tipo de escala en el que realmente deberías comenzar a pensar en este tipo de técnicas.

Es por esta razón que el ingeniero, estudioso de las redes neuronales desde principios de los noventa, cree que casi cualquier negocio que maneje decenas o cientos de miles de interacciones con sus clientes tiene una suficiente cantidad de datos para valorar la opción del aprendizaje automático. Aunque los humanos continúen siendo necesarios, al menos en parte.

El factor humano continuará siendo clave en el Deep Learning

Hemos comentado que, según Dean, la cifra mínima para comenzar con garantías técnicas de aprendizaje profundo son 100.000 ejemplos. Aunque no basta solamente con poseer esa gran base de datos, también necesitamos de la intervención humana. Así lo expresa él mismo:

Hay mucho trabajo en los sistema de aprendizaje automático que no es realmente aprendizaje automático. Tienes que juntar los datos, quizás tener humanos para etiquetar los ejemplos y luego tienes que escribir algo de procesamiento de datos para producir el dataset que luego utilizarás en el aprendizaje automático.

O lo que es lo mismo: los humanos continúan siendo necesarios, al menos al principio y como mínimo en el momento actual. Y no es ninguna novedad, porque la razón la encontramos en la propia naturaleza del aprendizaje automático y el aprendizaje profundo.

Los datos necesitan tratamiento y los humanos, de momento, son los encargados de darlo

No se trata de mostrarle a un ordenador un largo listado de instrucciones con posibles resoluciones de un problema. El Deep Learning busca dotar a un ordenador de un conjunto de ejemplos y una pequeña muestra de reglas que le permitan tanto extraer patrones a la hora de solucionar un problema como modificar esos mismos modelos en busca de otras soluciones.

Por eso es importante su catalogación y la intervención, durante los inicios, de los humanos. Por eso también, entre otras razones, la demanda de trabajadores cualificados en inteligencia artificial es tan extrema. La gran importancia del factor humano es un obstáculo, en el momento actual, que las inteligencias artificiales deben salvar para continuar con su desarrollo. Es tiempo de procesamiento de datos y de intervención que sí o sí hay que emplear.

Imagen | geralt
En Genbeta | Una inteligencia artificial es capaz de reconocer a la gente incluso con la cara tapada

Loading...