martes, 11 de mayo de 2010

La creciente dificultad léxica de la ciencia

Los científicos han dejado de ser personajes públicos hace años. Bien pocos avances científicos se pueden entender fácilmente. La frontera del conocimiento está muy lejos de lo que se explica en bachillerato. Pero hay una cuestión más que a menudo pasa desapercibida: el lenguaje que se utiliza en ciencia es cada vez más complejo.

Unas pocas entradas atrás comentábamos sobre la ley de distribución estadística de las palabras que conforman textos: la Ley de Zipf. En un estudio (publicado en Nature en 1992 y disponible en preprint aquí) se utiliza una esa idea, sofisticándola un poco, para generar un índice de dificultad léxica de los textos. Es un índice relativo, y para darle un valor absoluto el autor utiliza como referencia los periódicos. Se asume que el lenguaje de los periódicos generalistas es el cero de dificultad léxica. Frente a él las locuciones de un granjero hablándole a sus vacas puntúa -59, los cómics -27, Science 28 y Cell 38. Pero más interesante aún resulta que se puede hacer un seguimiento en el tiempo. Suponiendo que los periódicos se mantienen como nivel de referencia en todo momento, se puede medir la dificultad de una publicación en distintos momentos del tiempo.

Aplicando esta metodología se comprueba que la dificultad puramente léxica de los textos científicos se ha incrementado sensiblemente a lo largo del siglo XX. Hay datos sorprendentes, como que hasta 1947 Nature mantuvo un nivel próximo a 0. Se puede analizar este aumento de dificultad por disciplinas, por tipo de revistas, y respecto de la política editorial de las mismas (ver texto original).

Yo me quedo con dos ideas: hoy en día los cualquier texto científico utiliza un léxico sensiblemente más complejo que el utilizado por la población en general (indicado por los periódicos). Aunque Scientific American (Mundo Científico) se ha complicado menos que revistas más especializadas, ha perdido el nivel léxico de la calle, y el hueco no se ha cubierto. Según el autor del trabajo no hay revistas de divulgación con índice de dificultad léxica 0.

Lo que no queda claro es la causa última de la complicación del lenguaje científico. Puede deberse a que los temas de trabajo se especializan, se diversifican y crean jergas específicas. Pero no sería de extrañar que hubiese otros motivos. No deja de ser curiosa la coincidencia del despegue de la dificultad léxica con el comienzo de la evaluación de los científicos por número de publicaciones. En todo caso esta cuestión queda abierta por ahora.

5 comentarios:

Ambros dijo...

No conozco las causas pero el artículo me parece interesante. ¿alguna idea de como puntuarian los blogs de ciencia y tecnología?

Tengo la impresión de que al ensanchar el hueco acaba apareciendo alguien para cubrirlo. Todo sea para que la ciencia no se aleje demasiado de la gente.

Joaquín Sevilla dijo...

Es muy interesante lo que comentas. Lamentablemente en el artículo original se dan pistas, pero no la receta detallada para calcular el mismo índice. Se podrían rastrear otros artículos del autor y demás. Un curro un punto excesivo para la cantidad de líos en que ando, pero si alguien se anima...
Es muy probabale que en efecto se rellene ese hueco con los blogs de divulgación, al menos en castellano me da esa impresió.

RKincaid dijo...

Me gustaría aportar un par de cuestiones en este comentario. La primera de ellas es una apreciación bastante extendida y que creo que es absolutamente cierta: cuando alguien extremadamente inteligente domina un tema es capaz de explicarlo de forma sencilla y clara de tal manera que resulta fácil de entender. Mucha gente camufla su inseguridad, ignorancia o pretende aparentar cosas que no sabe haciendo piruetas de todo tipo.

Por otro lado creo que la proliferación de publicaciones científicas de todo tipo (exponencial) ha crecido mucho más que la zona derecha de la campana de Gauss donde se acumulan el escaso porcentaje de personas con capacidad de generar conocimiento científico de valor. Quiero decir (de forma muy vulgar, pero para que se me entienda) que cada vez hay más tontos publicando más y más cosas incomprensibles. El genio sigue estando limitado y empiezo ya a dudar de que las personas verdaderamente geniales se estén dedicando a la ciencia... cada vez mi impresión es más y más pesimista al respecto.

Un saludo

Joaquín Sevilla dijo...

Yo, en camibio, creo que la cantidad, la calidad y la dificultad léxica son relativamente independientes. Se suele decir que en este momento hay tantos científicos en activo como a lo largo de toda la historia de la humanidad juntos. Y ese número crece exponencialmente. La incorporación de China en el ultimos años es espectacular. Es de esperar, por tanto, que crezca el número de artículos publicados. Respecto de la calidad promedio de los mismos no tengo ninguna hipótesis. Y de la misma manera no veo clara la relación de todo esto con el dato estudiado en el artículo en que se basa el post del crecimiento de la dificultad léxica... Pero por poder, podría ser

Naeros dijo...

Respecto a la divulgación en blogs yo me he hecho fiel seguidor de El Tamiz
(eltamiz.com).
Lo comento por si a algún lector de este blog (también de divulgación) le puede interesar =)