Hola, soy Rubén Manrique. El objetivo de este video es introducir el procesamiento de lenguaje natural; una de las tareas de mayor relevancia en la inteligencia artificial. La organización de este video es la siguiente. Primero, se realizará una definición global de la AI. Luego, procederemos a definir qué es un lenguaje y sus principales componentes. También hablaremos de algunas aplicaciones cotidianas del procesamiento de lenguaje natural; aplicaciones muy cercanas a nosotros y con las cuales interactuamos día a día. Finalizaremos con unas conclusiones. El procesamiento de lenguaje natural es un área de la inteligencia artificial que se encarga del entendimiento del lenguaje humano a través de un computador. La palabra o el término "natural" se utiliza para hacer referencia a los lenguajes humanos con fines comunicativos y no a otros tipos de lenguaje como, por ejemplo, los lenguajes de programación. Para entender mejor la definición es necesario adentrarnos en el mundo de los lenguajes. La primera pregunta que debemos responder es, ¿qué es un lenguaje? Podemos definir el lenguaje humano como un sistema basado en el uso de signos que permiten la composición de palabras y sentencias según un complejo sistema de reglas. El lenguaje escrito está compuesto por un alfabeto, una morfología, la sintaxis y la semántica. La suma de los aspectos morfológicos de la palabra y la sintaxis constituyen la gramática del lenguaje. El alfabeto es un sistema ordenado de signos gráficos que se emplean para la construcción de una palabra. Nuestro conocido abecedario del castellano nos provee de 27 símbolos denominados letras, de los cuales 22 son consonantes y 5 son vocales. La morfología, por otra parte, define las reglas que rigen la flexión, la composición y la derivación de las palabras. Por ejemplo, la palabra "gata" se construye a partir de la raíz "gat" y el morfema flexivo "a". La raíz de la palabra carga con el principal significado de la misma y se suele denominar con el nombre de lexema, mientras que el morfema flexivo añade información sobre el género. La sintaxis son las reglas que nos permiten combinar correctamente las palabras para formar sentencias. Por ejemplo, una regla para formar correctamente oraciones simples es que esta tenga un sujeto, un verbo y un complemento. En la sentencia, "La gata corre por el jardín". "La gata" es el sujeto, la entidad sobre la cual recae la acción. "Corre" es el verbo o la acción que ejecuta el sujeto y "en el jardín" es el complemento que acompaña al verbo o sujeto para completar el sentido de la oración. La semántica dota a las palabras y oraciones de un significado. Por ejemplo, cuando usamos la palabra "gata" nos referimos usualmente al animal mamífero doméstico de la familia de los félidos. Las palabras pueden tener más de un significado, en cuyo caso se denominan palabras polisémicas. Por ejemplo, la palabra "gato" puede hacer referencia al animal doméstico o a la herramienta para levantar objetos del suelo. En dichos casos, identificar el significado correcto de la palabra dependerá del contexto de uso, el cual generalmente viene dado por otras palabras que componen la sentencia u oración. Finalmente, si no solo hablamos del lenguaje escrito, sino también del lenguaje hablado, debemos incluir la fonética como otro componente del lenguaje. La fonética nos define los sonidos del lenguaje y las reglas que gobiernan la combinación de estos. Volvamos nuevamente al área del procesamiento del lenguaje natural. La principal pregunta que trata de responder esta área de la inteligencia artificial es, ¿cómo podemos dotar a las computadoras con la capacidad de comprender el lenguaje natural del ser humano, escrito y hablado? Dada la complejidad del lenguaje en sus componentes, parece una tarea titánica. Sorprendentemente, existen muchos avances en el área que han permitido que las máquinas tengan un entendimiento parcial del lenguaje para tareas muy específicas. Algunos de estos avances los utilizamos en nuestra vida cotidiana. Quizás, la aplicación más común a todos nosotros son los sistemas de corrección ortográfica que se encuentran embebidos en la mayoría de los procesadores de texto. Los sistemas de corrección ortográfica identifican errores en la escritura y uso de las palabras y, además, identifican estructuras de sentencias que no siguen las reglas sintácticas del lenguaje. No es común que estos sistemas lleguen a evaluar el texto a un nivel semántico para entender su significado y analizar aspectos importantes como la cohesión y coherencia. Estas propiedades, tanto la cohesión como la coherencia, permiten especificar el grado de relación entre las sentencias que componen un texto a nivel de su significado. Se espera de un texto bien redactado que sea coherente, manteniendo relaciones lógicas entre las sentencias que lo componen. Otra de las aplicaciones que hacen uso de los avances de procesamiento de lenguaje natural son los buscadores web. Con certeza, todos nosotros los usamos a diario; los buscadores web reciben una consulta que expresa una necesidad de información por parte del usuario y retornan páginas web relacionadas que normalmente responden a dicha necesidad. Lo asombroso de estos sistemas es la rapidez de búsqueda sobre millones de páginas web existentes. Además, estos buscadores incorporan algoritmos de análisis sintáctico y semántico para realizar sugerencias de corrección de la consulta, en caso de existir errores ortográficos o en caso de existir formas alternativas de escribir la misma consulta con otras palabras, preservando su significado. Tenemos también los sistemas de respuestas a preguntas. Estos sistemas intentan responder a preguntas formuladas por los usuarios de forma automática. Se hicieron populares en el área de procesamiento de lenguaje natural en el 2011 cuando una inteligencia artificial de IBM, llamada Watson, ganó el concurso de televisión Jeopardy. En este concurso los jugadores responden a preguntas en diferentes áreas del conocimiento. Para responder una pregunta como, "¿cuál es la capital de Japón?" la inteligencia artificial debe comprender la intención de la pregunta. Por un lado, se le está solicitando la capital de un país, pero no cualquier país; se está enfocando en uno solo que es Japón. Debe, entonces, entender el concepto de capital y también que la palabra Japón hace referencia a un país. Entender estos elementos semánticos son cruciales para retornar la respuesta correcta. Los asistentes de voz son sistemas de chat y respuestas a preguntas que se enfocan en el lenguaje hablado o discurso. Ejemplos muy populares de estos asistentes son Alexa de Amazon, Cortana de Microsoft y Siri de Apple. Adicional a las capacidades de un sistema de respuesta a preguntas, estos asistentes virtuales deben incorporar análisis fonético para el reconocimiento de voz y algoritmos de generación de discurso para expresar respuestas fonéticamente y sintácticamente validas. Finalmente, encontramos los sistemas de traducción. Estos sistemas son capaces de transformar texto o discurso de un lenguaje en origen a otro lenguaje destino, preservando el significado o lo más que se pueda de él. Y cumpliendo, además, con las reglas gramaticales del lenguaje destino. La traducción es una tarea compleja, ya que se debe producir un texto cuyo significado o semántica sea equivalente al texto en el lenguaje de origen. Sólo por exponer uno de los desafíos, considere los casos en que las palabras del lenguaje de origen no tienen un equivalente en el lenguaje de destino. Por ejemplo, la palabra "tartle" del escocés, se usa para denotar la incomodidad al saludar o presentar a alguien cuyo nombre no recuerdas. Esta palabra no tiene traducción directa a nuestra lengua castellana. Nuestras conclusiones son, entonces, las siguientes: el procesamiento de lenguaje natural es el área que busca dotar a las computadoras con la capacidad de comprender el lenguaje humano. El lenguaje está compuesto por un alfabeto, gramáticas que describen las reglas morfológicas y sintácticas y la semántica. El procesamiento del lenguaje natural hace parte de nuestra realidad. Hacemos uso de aplicaciones de procesamiento de lenguaje natural en nuestro día a día. Como tarea, por favor, piensen en otras aplicaciones de procesamiento de lenguaje natural que ustedes utilizan frecuentemente. Muchas gracias.