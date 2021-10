El autocorrector lleva con nosotros desde hace años, mostrando sugerencias o sustituyendo aquellas palabras que hemos escrito mal. Con la llegada de los Google Pixel 6 y el nuevo motor neuronal de su chip tensor, Google quiere llevar esta autocorrección aún más allá, analizando la propia gramática de las frases que escribimos.

Una corrección de gramática de forma instantánea y local

Google quiere mejorar el autocorrector de Android (en el teclado Gboard) y, para ello, ha entrenado una red neuronal que toma una frase de entrada y logra ejecutar su versión gramaticalmente correcta. En el caso de que la frase de entrada sea correcta, el modelo no hace corrección alguna y ofrece una salida idéntica a dicha entrada.

Para entrenar a este modelo, se necesitan datos en forma de pares de texto (texto original – texto corregido), para lo que han usado una enorme base de datos con millones de frases de toda la web. Este primer conjunto de datos de entrenamiento de pares de frases se emplea posteriormente para entrenar al propio modelo final, capaz de corregir frases completas.

Del mismo modo indican que, para que el modelo pueda corregir la gramática en tiempo real, es necesario analizar los prefijos de las frases, ya que estos determinan buena parte de cómo se ha de escribir lo demás.

«Esto plantea la cuestión de cómo decidir si un prefijo de frase dado es gramaticalmente correcto. Utilizamos una heurística para resolverlo: si un prefijo de frase dado puede completarse para formar una frase gramaticalmente correcta, lo consideramos correcto. Si no lo es, se supone que es incorrecta.» Google.

Para lograr esto, Google ha creado un segundo conjunto de datos centrado en los propios prefijos. En este caso, nos ponen un ejemplo en inglés de dos pares de frases: la frase mal escrita ‘She puts a lot of effort yesterday afternoon’ y la frase corregida ‘She put in a lot of effort yesterday afternoon’. Aunque sea un ejemplo en inglés, este análisis de prefijos se aplicará en los distintos idiomas.

Según Google, la clave de este modelo es que todo se realiza de forma local. Se programa en el propio dispositivo y, cuando usamos Gboard, la app envía una solicitud al propio modelo de gramática cada vez que el usuario escribe más de tres palabras. Este modelo ocupa 22 megas de almacenamiento y lo gestiona la propia CPU del teléfono.

