Una de mis obsesiones es la de poner en valor la figura de los expertos generalistas como elemento necesario para poder desarrollar proyectos innovadores que frecuentemente mezclan conceptos o propuestas de valor de diferentes dominios de conocimiento que trascienden los límites tradicionales o incluso los transgreden. El concepto de experto generalista, lo he desarrollado en otras entradas de este blog, por ejemplo, aquí, por lo que remito al amable lector que no lo conozca a dicha entrada.

Foto por Ousa Chea on Unsplash

Otro ámbito en el que hasta ahora no se ha visto a los expertos generalistas es en el de la investigación, ámbito que se considera la esencia de la superespecialización que nos invade. Pero lo cierto es que, también es posible llevar un programa de investigación generalista que, necesariamente, debe descansar en la investigación especialista, pero que se pregunta por cuestiones que pueden ser de interés para ligar entre sí ámbitos distintos de conocimiento y, finalmente, puede sugerir nuevos campos de investigación en el ámbito especialista.

La diferencia es que, dependiendo del nivel de profundidad de nuestra investigación generalista está puede ser realizada a tiempo parcial, a diferencia de la investigación especialista, que normalmente es a tiempo completo. Yo distingo dos niveles de investigación generalista para poder conectar dos campos de conocimiento diferentes:

  1. El nivel básico de recopilar y leer artículos y noticias sobre un tema determinado y, en determinados casos, leer de forma cruzada (luego explico esto) algunos artículos especialistas clave.
  2. El nivel avanzado con programa de investigación generalista específico.

El nivel básico está al alcance de cualquier aspirante a experto generalista, mientras que el nivel avanzado puede consumir bastante tiempo, por lo que, como aquellos experimentos peligrosos que hacen algunas personas con gran maestría en algún dominio, hay que decir: “las personas que estén en el sector privado y no se dediquen ya a la investigación, con poco tiempo libre, por favor, no intenten hacer esto, si es que quieren tener algún tipo de vida personal, familiar y social”. No es una cuestión de capacidad, pues todo el mundo tiene mucha más capacidad de la que él o ella mismo cree, es una cuestión de tiempo disponible.

La investigación generalista básica

En este nivel, lo mejor es no acudir en primera instancia a los artículos de investigación (conocidos como papers), dado que en cualquier tema hay centenares, si no miles, dirigidos casi exclusivamente al universo especialista. Para ello lo que hay que identificar algunas fuentes serias que hagan ese primer desbroce para nosotros. Naturalmente las fuentes variarán completamente según sean los campos de nuestro interés. Por ejemplo, para el campo de la Inteligencia Artificial yo uso, entre otros, “Two minutes papers” de Károly Zsolnai-Fehér, que es un ejemplo perfecto de ahorro de tiempo para los investigadores especialistas en IA, simulaciones y gráficos por ordenador, de una forma audiovisual muy atractiva y que los generalistas también podemos usar para nuestros propios propósitos.  Para cuestiones relacionadas con la inteligencia artificial general, el podcast de Lex Fridman, aunque este hay que tomárselo a pequeñas dosis porque las charlas que tiene con los distintos expertos mundiales con los que habla en ocasiones alcanzan las ¡tres horas y media!, aunque a veces extracta trozos cortos (clips) de las partes más importantes para hacerlos digeribles.

En cuanto a la información escrita, no sólo de Inteligencia Artificial (IA), sino sobre distintos aspectos que podríamos denominar bajo el epígrafe “sociedad digital”, la revista digital medium.com, futurism.com o la revista MIT Tech Review, son algunas de las fuentes que utilizo para hacer este proceso de cribado de los materiales que pueden ser de mi interés (¡ojo!, algunas son de pago, pero estar bien informado tiene un precio). Seguro que el lector puede identificar fácilmente sus propias fuentes en sus campos de interés. A veces utilizo la revista de mi propio colegio profesional, aunque normalmente esto lo hago para tener una medida de cuál es el grado de conocimiento del sector en España y dónde nos encontramos en relación con el mundo.

En el caso de economía o negocios en general, además de la prensa económica generalista y más especializada (tipo “Expansión” o “cinco días”, “The economist”) o, a veces, acudo a revistas como “Harvard Business Review”.

Esto combinado con la prensa generalista para conocer los temas de actualidad, debería ser suficiente para alcanzar este conocimiento general, que es mayor que el que tiene una persona informada, porque puede hacer conexiones entre campos que a ésta le resulta más difícil relacionar.

La investigación generalista avanzada

Pero, en un momento dado, es posible que el investigador generalista deba acudir a la lectura de artículos de investigación (papers), porque quiera profundizar más en un tema. En este caso, nunca se debe leer palabra por palabra un paper. Hay tres motivos por los que nos acercamos a un paper[1]: para aprender una nueva técnica, en busca de inspiración para nuevos temas para investigar y, finalmente, para buscar una solución a nuestra propia investigación (generalista, añado).

Lo primero que hay que hacer es un cribado a partir del título y del resumen (abstract) donde se identifica el alcance, el problema, la solución y el impacto. Si tanto el título como el resumen están relacionados con la necesidad que nos hizo buscar papers, entonces con alto nivel de confianza el paper es el adecuado.

A continuación, identificamos cada una de estas partes en el cuerpo del paper y pasamos a leer, ahora si con atención, aquellas que sean relevantes para nuestra necesidad.

Si nuestra necesidad es aprender una nueva técnica, tenemos que ir directamente a la sección sobre método y materiales y aprender cómo eligieron sus controles para los experimentos. Cada párrafo suele ser una técnica distinta excepto cuando el paper trata de una nueva técnica, en cuyo caso ésta abarcará toda la sección.

Si lo que buscamos es inspiración, lo más práctico es ir a los apartados discusión y resultados, los detalles no son importantes. Aquí, los investigadores suelen hablar de las limitaciones del método utilizado, o las limitaciones al alcance del estudio. A veces anuncian cuál es el siguiente paso de importancia en la investigación. ¿Qué problema solucionaron? ¿Se puede usar esta estrategia en otros problemas aún abiertos? ¿Y en otro campo? (cuanto más lejos del campo inicial podamos proyectarlo, mejor estaremos haciendo nuestra labor generalista).

Si lo que buscamos es una solución a nuestra propia investigación, aunque se trata de una cuestión más para investigadores especialistas, aun podemos preguntarnos legítimamente, ¿puedo utilizar esta estrategia en mi problema?

Normalmente un programa de investigación especialista parte de una pregunta aparentemente “simple”, por ejemplo, “¿cómo podríamos predecir las propiedades generales que un determinado tipo de doblado de proteínas va a tener a la hora de desarrollar una vacuna para la covid-19?”, “¿Cómo afecta la nueva información sobre un determinado evento al comportamiento de las bolsas?, ¿Existe alguna alternativa para el aprendizaje de las redes neuronales al algoritmo de retro propagación? (que hace algunas asunciones no realistas)

Mi programa de investigación generalista en IA

Un programa de investigación generalista, a diferencia de la investigación especialista clásica, por su naturaleza puede contener varias preguntas, a menudo una lista de preguntas más o menos relacionadas. A fin de demostrar de forma más tangible de lo que estoy hablando en este artículo voy a exponer mi propio programa de investigación generalista avanzada, de manera que pueda servir de referencia a otros aspirantes a expertos generalistas investigadores, para diseñar su propio programa en sus ámbitos de interés.

La siguiente lista de preguntas están todas relacionadas con el camino hacia una inteligencia artificial general, que es el tema que me introdujo en el campo de la IA:

  1. ¿Cómo podemos saber en qué punto de una curva exponencial nos encontramos? (o si, de hecho, es exponencial)
  2. En un sistema complejo, ¿cómo podemos saber, desde dentro de él, en que tipo de régimen nos encontramos? (convergente, atractores fijos, atractores periódicos, caos)
  3. ¿Cómo podemos hacer redes neuronales más complejas que permitan aprender a partir de pocos ejemplos o incluso sin ejemplos?
  4. ¿Existe alguna manera de generar jerarquías de objetos y relaciones de forma automática desde el nivel subsimbólico (i.e. Deep Learning)? (este problema se denomina hueco semántico)
  5. ¿Cómo podemos representar de forma automática los diferentes significados de las palabras según el contexto en que se pronuncien? (este problema es una parte de la denominada adaptación contextual)
  6. ¿Cómo funcionan la intuición y la creatividad artificiales (i.e. redes GAN, GPT-2 y 3)?
  7. ¿Pueden converger los modelos del mundo de los sistemas de inteligencia artificial dedicados a la inversión en los mercados de valores? (esto significa el fin de la Bolsa y de la economía capitalista actual)
  8. ¿Es la consciencia un requisito necesario para la inteligencia artificial general?
  9. ¿Cuáles son los bloques funcionales que debería tener un sistema de IA general que aspire a ser comparado con un ser humano, desde el punto de vista de la neurociencia?
  10. Pueden las máquinas pensar?

(Esto es una continuación de la investigación original de Alan Turing, salvando las distancias con el genio claro, pero con la ventaja de 65 años de IA)

Un ejemplo de investigación generalista

La investigación preliminar sobre este programa tiene que sentar las bases sobre qué preguntas están relacionadas y pueden tener elementos en común. Por ejemplo, la 7) sólo está relacionada con la 2) pero ésta a su vez tiene relación con la 1). La 8) y la 10) son muy generales y probablemente involucran a otras preguntas de la lista y seguramente algunas otras que deberemos incorporar posteriormente para poder responderlas adecuadamente, lo que probablemente implique la investigación en otros campos como la psicología, la neurociencia o la lógica. El resto de la lista son preguntas más específicas sobre distintos aspectos de la IA, que podrían ser resueltos a partir de las investigaciones especialista en IA.

A fin de aclarar un poco los conceptos vertidos, voy a plantear brevemente, a modo de ejemplo una de las preguntas de la lista junto con las posibles implicaciones que podría tener ser capaz de responderlas.

Pregunta: ¿Cómo podemos hacer redes neuronales más complejas que permitan aprender a partir de pocos ejemplos o incluso sin ejemplos?

Uno de los problemas del aprendizaje supervisado basado en redes neuronales (y también en otras técnicas como las máquinas de vectores de soporte -SVM-) es que necesitan de miles, centenares de miles o a veces millones de muestras de entrenamiento, etiquetadas, para aprender un concepto, lo que dificulta mucho el aprendizaje y eleva los costes de entrenamiento de forma muy notable, lo que constituye una barrera de entrada para muchas empresa pequeñas y medianas.

Por el contrario, el aprendizaje humano se produce con una o pocas muestras de entrenamiento, lo que es una enorme ventaja y un gran obstáculo en el camino hacia una inteligencia artificial general. Además, otra debilidad de los sistemas de redes neuronales artificiales es la fragilidad de lo aprendido, para aprender a reconocer un patrón nuevo, se puede producir un “olvido catastrófico” de lo aprendido anteriormente.

Foto por Franki Chamaki on Unsplash

Para poder tener esa capacidad de generalización y robustez a la hora de aprender nuevos conceptos sin “olvidar” los ya adquiridos, se necesita que las redes neuronales artificiales tengan una arquitectura más compleja que permita representar y razonar con una expresividad similar a la que proporciona la lógica de primer orden.

Existen algunas propuestas en ese sentido (por ejemplo, las columnas neocorticales básicas de Kurzweil o las redes neuronales de impulsos), pero hay que explorar los resultados que estas propuestas han producido, para ver si podrían plantearse sistemas de aprendizaje profundo basados en una arquitectura de neuronas más compleja y si ello mejoraba los aspectos señalados. Poder entrenar estos sistemas a partir de unos pocos ejemplos y que fueran capaces de generalizar correctamente en la mayoría de las ocasiones sería un gran paso para la adopción de estos sistemas de forma ubicua. Esto habilitaría la existencia de una inteligencia ambiental a nuestro alrededor, que nos hiciera olvidarnos de la IA como en su día lo hicimos de la electricidad.

¿Dónde nos paramos en la profundidad de la investigación? Bueno el nivel de profundidad lo fijan la base de conocimientos y capacidades de cada uno, así como el tiempo disponible y el uso que se vaya a hacer de los resultados de la investigación, en particular si a partir de los resultados se va a disponer de especialistas o no. ¿Dónde me paro yo en IA? Pues mi frontera generalmente suele estar fijada en el llamado pseudo código que implementa un algoritmo de IA, o en el código que realmente se ejecuta (normalmente en Python y a veces en R). No suelo interesarme por escribir código, salvo excepciones relativamente simples, porque eso obliga a un conocimiento de las librerías de alto y medio nivel que existen en IA, que me haría perder demasiado tiempo en mi exploración. También me suelen interesar saber lo que hacen los llamados híper parámetros del algoritmo y cómo influyen, pero no el “trastear” con ellos, por las mismas razones que pasa con el código.

En otros campos con los que estoy menos familiarizado, la profundidad que necesito es menor y me suelen interesar los principios básicos y algunos estudios clave, por ejemplo, en el campo de la economía o en el de los sistemas complejos.

 

Con esta breve reflexión sobre uno de los puntos de mi programa de investigación generalista, concluyo este artículo. Es posible desarrollar un programa de investigación generalista, de la misma manera que desde hace mucho tiempo se vienen desarrollando los programas de investigación especialista, sólo que nadie los llama así, sino que se les denomina “investigación”. Esperemos que estos programas generalistas se popularicen de manera que podamos hablar en el futuro con toda propiedad de una “investigación generalista”.


[1] Este parte está basada principalmente en el artículo “how to read a research paper” de Kok Zhi Lee, en medium.com

 

Posted by santiago

Deja un comentario