banner
Hogar / Blog / Los documentos y las patentes se están volviendo menos perjudiciales con el tiempo
Blog

Los documentos y las patentes se están volviendo menos perjudiciales con el tiempo

Jun 09, 2023Jun 09, 2023

Nature, volumen 613, páginas 138–144 (2023)Citar este artículo

290k Accesos

43 citas

4052 Altmetric

Detalles de métricas

Las teorías del cambio científico y tecnológico ven el descubrimiento y la invención como procesos endógenos1,2, en los que el conocimiento previo acumulado posibilita el progreso futuro al permitir a los investigadores, en palabras de Newton, 'subirse a hombros de gigantes'3,4,5,6,7. Las últimas décadas han sido testigos de un crecimiento exponencial en el volumen de nuevos conocimientos científicos y tecnológicos, creando así las condiciones que deberían estar maduras para grandes avances8,9. Sin embargo, contrariamente a esta opinión, los estudios sugieren que el progreso se está desacelerando en varios campos importantes10,11. Aquí, analizamos estas afirmaciones a escala a lo largo de seis décadas, utilizando datos de 45 millones de artículos y 3,9 millones de patentes de seis conjuntos de datos a gran escala, junto con una nueva métrica cuantitativa, el índice CD12, que caracteriza cómo los artículos y las patentes cambian las redes de citas. en ciencia y tecnología. Descubrimos que es cada vez menos probable que los documentos y las patentes rompan con el pasado de manera que impulsen la ciencia y la tecnología en nuevas direcciones. Este patrón se mantiene universalmente en todos los campos y es sólido en múltiples métricas diferentes basadas en citas y texto1,13,14,15,16,17. Posteriormente, vinculamos esta disminución de la perturbación con una reducción en el uso del conocimiento previo, lo que nos permite reconciliar los patrones que observamos con la visión de 'hombros de gigantes'. Encontramos que es poco probable que las disminuciones observadas sean impulsadas por cambios en la calidad de la ciencia publicada, las prácticas de citación o factores específicos del campo. En general, nuestros resultados sugieren que la desaceleración de las tasas de disrupción puede reflejar un cambio fundamental en la naturaleza de la ciencia y la tecnología.

Aunque el siglo pasado fue testigo de una expansión sin precedentes del conocimiento científico y tecnológico, existe la preocupación de que la actividad innovadora se esté desacelerando18,19,20. Los estudios documentan la disminución de la productividad de la investigación en semiconductores, productos farmacéuticos y otros campos10,11. Los artículos, las patentes e incluso las solicitudes de subvenciones se han vuelto menos novedosos en relación con el trabajo anterior y es menos probable que conecten áreas dispares del conocimiento, las cuales son precursoras de la innovación21,22. La brecha entre el año del descubrimiento y la concesión del Premio Nobel también ha aumentado23,24, lo que sugiere que las contribuciones de hoy no están a la altura del pasado. Estas tendencias han atraído cada vez más la atención de los formuladores de políticas, ya que representan amenazas sustanciales para el crecimiento económico, la salud y el bienestar humanos y la seguridad nacional, junto con los esfuerzos globales para combatir grandes desafíos como el cambio climático25,26.

Se han propuesto numerosas explicaciones para esta desaceleración. Algunos apuntan a una escasez de 'frutas al alcance de la mano' ya que las innovaciones que mejoran la productividad ya están disponibles19,27. Otros enfatizan la creciente carga del conocimiento; los científicos e inventores requieren cada vez más capacitación para llegar a las fronteras de sus campos, dejando menos tiempo para impulsar esas fronteras18,28. Sin embargo, aún se desconoce mucho, no solo sobre las causas de la desaceleración de la actividad innovadora, sino también sobre la profundidad y amplitud del fenómeno. El declive es difícil de conciliar con siglos de observación por parte de los filósofos de la ciencia, quienes caracterizan el crecimiento del conocimiento como un proceso endógeno, en el que el conocimiento previo permite el descubrimiento futuro, un punto de vista capturado en la famosa observación de Newton de que si había visto más allá, fue por 'de pie sobre los hombros de gigantes'3. Además, hasta la fecha, la evidencia que apunta a una desaceleración se basa en estudios de campos particulares, utilizando métricas dispares y específicas de dominio10,11, lo que dificulta saber si los cambios están ocurriendo a un ritmo similar en todas las áreas de la ciencia y la tecnología. También se sabe poco acerca de si los patrones observados en los indicadores agregados enmascaran las diferencias en el grado en que las obras individuales traspasan la frontera.

Abordamos estas lagunas en la comprensión mediante el análisis de 25 millones de artículos (1945-2010) en la Web of Science (WoS) (Métodos) y 3,9 millones de patentes (1976-2010) en la base de datos Patents View de la Oficina de Patentes y Marcas de los Estados Unidos (USPTO). (Métodos). Los datos de WoS incluyen 390 millones de citas, 25 millones de títulos de artículos y 13 millones de resúmenes. Los datos de Patents View incluyen 35 millones de citas, 3,9 millones de títulos de patentes y 3,9 millones de resúmenes. Posteriormente, replicamos nuestros hallazgos principales en cuatro conjuntos de datos adicionales: JSTOR, el corpus de la Sociedad Estadounidense de Física, Microsoft Academic Graph y PubMed, que abarcan 20 millones de artículos. Usando estos datos, nos unimos a una nueva medida basada en citas12 con análisis textuales de títulos y resúmenes para comprender si los artículos y las patentes forjan nuevas direcciones a lo largo del tiempo y en todos los campos.

Para caracterizar la naturaleza de la innovación, nos basamos en las teorías fundamentales del cambio científico y tecnológico2,29,30, que distinguen entre dos tipos de avances. Primero, algunas contribuciones mejoran las corrientes de conocimiento existentes y, por lo tanto, consolidan el statu quo. Kohn y Sham (1965)31, un artículo ganador del Nobel, utilizó teoremas establecidos para desarrollar un método para calcular la estructura de los electrones, lo que consolidó el valor de investigaciones anteriores. En segundo lugar, algunas contribuciones alteran el conocimiento existente, lo vuelven obsoleto e impulsan la ciencia y la tecnología en nuevas direcciones. Watson y Crick (1953)32, también ganador del Nobel, introdujeron un modelo de la estructura del ADN que superó los enfoques anteriores (por ejemplo, la triple hélice de Pauling). Kohn, Sham, Watson y Crick fueron importantes, pero sus implicaciones para el cambio científico y tecnológico fueron diferentes.

Cuantificamos esta distinción utilizando una medida, el índice CD12, que caracteriza la naturaleza consolidante o disruptiva de la ciencia y la tecnología (Fig. 1). La intuición es que si un artículo o una patente es perjudicial, es menos probable que el trabajo posterior que lo cita también cite a sus predecesores; para futuros investigadores, las ideas que intervinieron en su producción son menos relevantes (por ejemplo, la triple hélice de Pauling). Si un documento o patente se está consolidando, es más probable que el trabajo posterior que lo cita también cite a sus predecesores; para futuros investigadores, el conocimiento sobre el que se construye el trabajo sigue siendo (y quizás más) relevante (por ejemplo, los teoremas que usaron Kohn y Sham). El índice CD varía de −1 (consolidación) a 1 (disruptivo). Medimos el índice de CD cinco años después del año de publicación de cada artículo (indicado por CD5, consulte Datos extendidos Fig. 1 para la distribución de CD5 entre artículos y patentes y Datos extendidos Fig. 2 para análisis usando ventanas alternativas)33. Por ejemplo, Watson y Crick y Kohn y Sham recibieron más de cien citas dentro de los cinco años posteriores a su publicación. Sin embargo, el artículo de Kohn y Sham tiene un CD5 de −0,22 (que indica consolidación), mientras que el artículo de Watson y Crick tiene un CD5 de 0,62 (que indica interrupción). El índice de CD se ha validado ampliamente en investigaciones anteriores, incluso a través de la correlación con evaluaciones de expertos12,34.

Esta figura muestra una visualización esquemática del índice de CD. a, valor del índice CD de tres artículos ganadores del Premio Nobel31,32,58 y tres patentes notables59,60,61 en nuestra muestra, medido cinco años después de la publicación (indicado por CD5). b, Distribución de CD5 para artículos de WoS (n = 24 659 076) entre 1945 y 2010 y patentes de Patents View (n = 3 912 353) entre 1976 y 2010, donde un solo punto representa un artículo o patente. La dimensión vertical (arriba-abajo) de cada 'tira' corresponde a los valores del índice CD (con los valores del eje que se muestran en naranja a la izquierda). La dimensión horizontal (izquierda-derecha) de cada tira ayuda a minimizar los puntos superpuestos. Las áreas más oscuras en cada gráfico de franjas indican regiones más densas de la distribución (es decir, valores de CD5 observados con mayor frecuencia). Detalles adicionales sobre la distribución del índice CD se dan en Datos extendidos Fig. 1. c, Tres redes de citas hipotéticas, donde el índice CD está en el valor disruptivo máximo (CDt = 1), valor de punto medio (CDt = 0) y valor máximo de consolidación (CDt = −1). El panel también proporciona la ecuación para el índice CD y un cálculo ilustrativo.

En todos los campos, encontramos que la ciencia y la tecnología se están volviendo menos disruptivas. La Figura 2 traza el promedio de CD5 a lo largo del tiempo para artículos (Fig. 2a) y patentes (Fig. 2b). En el caso de los artículos, la disminución entre 1945 y 2010 oscila entre el 91,9 % (donde el promedio de CD5 disminuyó de 0,52 en 1945 a 0,04 en 2010 para 'ciencias sociales') al 100 % (donde el promedio de CD5 disminuyó de 0,36 en 1945 a 0 en 2010 para 'ciencias físicas'); en el caso de las patentes, la disminución entre 1980 y 2010 oscila entre el 78,7 % (donde el promedio de CD5 disminuyó de 0,30 en 1980 a 0,06 en 2010 para "informática y comunicaciones") al 91,5 % (donde el promedio de CD5 disminuyó de 0,38 en 1980 a 0,03 en 2010 para 'drogas y medicina'). Tanto para los artículos como para las patentes, las tasas de disminución son mayores en las primeras partes de la serie temporal y, para las patentes, parecen comenzar a estabilizarse entre los años 2000 y 2005. Para los artículos, desde aproximadamente 1980, la tasa de disminución ha sido más modesto en 'ciencias de la vida y biomedicina' y ciencias físicas, y más marcado y persistente en ciencias sociales y 'tecnología'. Sin embargo, en general, en relación con épocas anteriores, los documentos y patentes recientes hacen menos para impulsar la ciencia y la tecnología en nuevas direcciones. La similitud general en las tendencias que observamos en todos los campos es digna de mención a la luz de las teorías de la "fruta madura"19,27, que probablemente predeciría una mayor heterogeneidad en la disminución, ya que parece poco probable que los campos "consumieran" su fruta madura a un ritmo similar. tarifas o tiempos.

a,b, disminución de CD5 a lo largo del tiempo, por separado para artículos (a, n = 24 659 076) y patentes (b, n = 3 912 353). Para artículos, las líneas corresponden a las áreas de investigación de WoS; de 1945 a 2010 la magnitud de la disminución va del 91,9% (ciencias sociales) al 100% (ciencias físicas). Para las patentes, las líneas corresponden a las categorías de tecnología de la Oficina Nacional de Investigación Económica (NBER); de 1980 a 2010 la magnitud de la disminución oscila entre el 93,5% (computadoras y comunicaciones) y el 96,4% (medicamentos y medicina). Las bandas sombreadas corresponden a intervalos de confianza del 95%. Como elaboramos en los Métodos, este patrón de declive es resistente al ajuste por confusión de los cambios en las prácticas de publicación, citación y autoría a lo largo del tiempo.

Datos fuente

La disminución de la ciencia y la tecnología disruptivas también se puede observar utilizando indicadores alternativos. Debido a que crean desviaciones del statu quo, es probable que los documentos y patentes disruptivos introduzcan nuevas palabras (por ejemplo, las palabras utilizadas para crear un nuevo paradigma pueden diferir de las que se utilizan para desarrollar un paradigma existente)35,36. Por lo tanto, si la disrupción está disminuyendo, esperaríamos una disminución en la diversidad de palabras utilizadas en ciencia y tecnología. Para evaluar esto, la Fig. 3a, d documenta la relación tipo-token (es decir, palabras únicas/totales) de títulos de papel y patentes a lo largo del tiempo (Información complementaria, sección 1). Observamos disminuciones sustanciales, especialmente en los períodos anteriores, antes de 1970 para artículos y 1990 para patentes. Para los títulos de artículos (Fig. 3a), la disminución (1945-2010) oscila entre el 76,5 % (ciencias sociales) y el 88 % (tecnología); para los títulos de patentes (Fig. 3d), la disminución (1980-2010) oscila entre el 32,5 % (química) y el 81 % (informática y comunicaciones). Para los resúmenes de artículos (Datos ampliados, Fig. 3a), la disminución (1992–2010) oscila entre el 23,1 % (ciencias biológicas y biomedicina) y el 38,9 % (ciencias sociales); para los resúmenes de patentes (Datos ampliados, Fig. 3b), la disminución (1980-2010) oscila entre el 21,5 % (mecánica) y el 73,2 % (informática y comunicaciones). En la Fig. 3b, e, demostramos que estas disminuciones en la diversidad de palabras van acompañadas de disminuciones similares en la novedad combinatoria; Con el tiempo, es cada vez más probable que las palabras particulares que los científicos e inventores usan en los títulos de sus artículos y patentes se hayan usado juntas en los títulos de trabajos anteriores. De acuerdo con estas tendencias en el lenguaje, también observamos una disminución de la novedad en las combinaciones de trabajos anteriores citados por artículos y patentes, según una medida previamente establecida de 'combinaciones atípicas'14 (Datos ampliados Fig. 4).

a, d, Cifras que muestran una disminución en la diversidad del lenguaje utilizado en ciencia y tecnología según las palabras únicas/totales de los títulos de artículos de 1945 a 2010 (a, n = 24 659 076) y de títulos de patentes de 1980 a 2010 (d, n = 3.912.353). b, e, Cifras que muestran una disminución en la novedad del lenguaje utilizado en ciencia y tecnología en función del número de pares de palabras nuevos/pares de palabras totales introducidos cada año en los títulos de artículos de WoS desde 1945 hasta 2010 (b) y en Patentes Ver títulos de patentes de 1980 a 2010 (refs.1,17) (e). Para los artículos tanto en a como en b, las líneas corresponden a las áreas de investigación de WoS (n = 264 áreas de investigación de WoS × observaciones anuales). Para las patentes tanto en d como en e, las líneas corresponden a las categorías de tecnología NBER (n = 229 categoría de tecnología NBER × año de observaciones). c,f, Figuras que muestran la frecuencia de los verbos más utilizados en los títulos de artículos para la primera (roja) y la última (azul) décadas del período de observación en artículos (c, n = 24 659 076) y patentes (f, n = 3 912 353 ) títulos.

Datos fuente

La disminución de la actividad disruptiva también es evidente en las palabras específicas utilizadas por científicos e inventores. Si la disrupción está disminuyendo, razonamos que los verbos que aluden a la creación, descubrimiento o percepción de cosas nuevas deberían usarse con menos frecuencia a lo largo del tiempo, mientras que los verbos que aluden a la mejora, aplicación o evaluación de cosas existentes pueden usarse con más frecuencia35,36. La Figura 3 muestra los verbos más comunes en papel (Fig. 3c) y títulos de patentes (Fig. 3f) en la primera y última década de cada muestra (Información complementaria, sección 2). Aunque la caracterización precisa y cuantitativa de las palabras como 'consolidadoras' o 'perturbadoras' es un desafío en ausencia de contexto, la figura destaca un cambio claro y cualitativo en el lenguaje. En las primeras décadas, los verbos que evocaban creación (por ejemplo, 'producir', 'formar', 'preparar' y 'hacer'), descubrimiento (por ejemplo, 'determinar' e 'informar') y percepción (por ejemplo, 'medir' ') prevalecen tanto en los títulos de papel como en los de patentes. En las últimas décadas, sin embargo, estos verbos son casi completamente desplazados por aquellos que tienden a evocar más la mejora (por ejemplo, 'mejorar', 'mejorar' y 'aumentar'), la aplicación (por ejemplo, 'usar' y ' incluir') o evaluación (por ejemplo, 'asociar', 'mediar' y 'relacionar') de los conocimientos y artefactos científicos y tecnológicos existentes. En conjunto, estos patrones sugieren un cambio sustancial en la ciencia y la tecnología a lo largo del tiempo, con descubrimientos e inventos cada vez menos perturbadores, de acuerdo con nuestros resultados utilizando el índice CD.

Las tendencias agregadas que documentamos enmascaran una heterogeneidad considerable en la perturbación de los artículos y patentes individuales y una estabilidad notable en el número absoluto de trabajos altamente disruptivos (Métodos y Fig. 4). Específicamente, a pesar de los grandes aumentos en la productividad científica, la cantidad de artículos y patentes con valores de CD5 en el extremo derecho de la distribución permanece casi constante a lo largo del tiempo. Esta 'conservación' del número absoluto de documentos y patentes altamente disruptivos se mantiene a pesar de la considerable agitación en los campos subyacentes responsables de producir esos trabajos (Datos ampliados Fig. 5, recuadro). Estos resultados sugieren que la persistencia de grandes avances, por ejemplo, la medición de ondas de gravedad y las vacunas contra el COVID-19, no es incompatible con la desaceleración de la actividad innovadora. En resumen, la disminución de la perturbación agregada no excluye obras individuales altamente disruptivas.

Esta figura muestra el número de artículos disruptivos (a, n = 5 030 179) y patentes (b, n = 1 476 004) en cuatro rangos diferentes de CD5 (artículos y patentes con valores de CD5 en el rango [−1.0, 0) no están representados en la figura). Las líneas corresponden a diferentes niveles de perturbación medidos por CD5. A pesar de los aumentos sustanciales en el número de artículos y patentes publicados cada año, hay pocos cambios en el número de artículos y patentes altamente disruptivos, como lo demuestran las líneas rojas, verdes y naranjas relativamente planas. Este patrón ayuda a explicar las observaciones simultáneas de la evidencia agregada de la desaceleración de la actividad innovadora y los avances aparentemente importantes en muchos campos de la ciencia y la tecnología. Los gráficos insertados muestran la composición de los artículos y patentes más perturbadores (definidos como aquellos con valores de CD5 >0,25) por campo a lo largo del tiempo. La estabilidad observada en el número absoluto de documentos y patentes altamente disruptivos se mantiene a pesar de la considerable rotación en los campos subyacentes de la ciencia y la tecnología responsables de producir esos trabajos. 'Ciencias de la vida' denota el área de investigación de las ciencias de la vida y la biomedicina; 'electrical' denota la categoría de tecnología eléctrica y electrónica; 'drogas' denota la categoría de drogas y tecnología médica; y 'computadoras' denota la categoría de tecnología de computadoras y comunicaciones.

Datos fuente

¿Qué está impulsando la disminución de la disrupción? Anteriormente, sugerimos que nuestros resultados no son consistentes con las explicaciones que relacionan la desaceleración de la actividad innovadora con la disminución de la 'fruta madura'. Datos extendidos La Fig. 5 muestra que es poco probable que la disminución de la perturbación se deba a otros factores específicos del campo al descomponer la variación en CD5 atribuible a los efectos de campo, autor y año (Métodos).

Es poco probable que las tasas decrecientes de actividad disruptiva se deban a la disminución de la calidad de la ciencia y la tecnología22,37. Si lo fueran, entonces los patrones que se ven en la Fig. 2 deberían ser menos visibles en trabajos de alta calidad. Sin embargo, cuando restringimos nuestra muestra a artículos publicados en lugares de publicación de primer nivel como Nature, Proceedings of the National Academy of Sciences and Science o descubrimientos ganadores del Nobel38 (Fig. 5), la tendencia a la baja persiste.

Esta figura muestra cambios en CD5 a lo largo del tiempo para artículos publicados en Nature, Proceedings of the National Academy of Sciences (PNAS) y Science (gráfico insertado, n = 223,745) y artículos ganadores del Premio Nobel (gráfico principal, n = 635), con se destacan varios ejemplos destacados31,32,58,62,63,64,65,66. Los colores indican las tres revistas diferentes en el gráfico insertado; los colores indican los tres campos diferentes en los que se otorga el Premio Nobel en la trama principal. Las bandas sombreadas corresponden a intervalos de confianza del 95%. Para completar la historia, trazamos las puntuaciones del índice de CD para todos los artículos Nobel desde 1900 (el primer año en que se otorgó el premio); sin embargo, nuestros análisis principales comienzan en la era posterior a 1945, cuando los datos de WoS son generalmente más confiables. La figura indica que es poco probable que los cambios en la calidad de la ciencia publicada a lo largo del tiempo sean responsables de la disminución de la interrupción.

Datos fuente

Además, la tendencia no está impulsada por las características de los datos de WoS y UPSTO o nuestra derivación particular del índice CD; observamos disminuciones similares en la perturbación cuando calculamos CD5 en documentos en JSTOR, el corpus de la Sociedad Americana de Física, Microsoft Academic Graph y PubMed (Métodos), cuyos resultados se muestran en Datos extendidos Fig. 6. Mostramos además que la disminución es no es un artefacto del índice de CD al informar patrones similares usando derivaciones alternativas13,15 (Métodos y datos extendidos Fig. 7).

Las disminuciones en la perturbación tampoco son atribuibles a cambios en las prácticas de publicación, citación o autoría (Métodos). Primero, utilizando enfoques de la literatura bibliométrica39,40,41,42,43, calculamos varias versiones normalizadas del índice CD que se ajustaban a la tendencia creciente de artículos y patentes a citar trabajos anteriores44,45. Los resultados que usaron estos indicadores alternativos (datos extendidos, Fig. 8a, d) fueron similares a los que informamos en la Fig. 2. En segundo lugar, usando regresión, estimamos modelos de CD5 en función de las variables indicadoras para cada artículo o año de publicación de patente, junto con con controles específicos para el nivel de campo × año: número de artículos/patentes nuevos, número medio de artículos/patentes citados, número medio de autores o inventores por artículo, y nivel de artículo o patente, número de artículos o patentes citados, factores. Las predicciones de estos modelos indicaron una disminución en los documentos y patentes disruptivos (datos extendidos, Fig. 8b, e y tabla complementaria 1) que fue consistente con nuestros resultados principales. Finalmente, utilizando simulaciones de Monte Carlo, reconfiguramos aleatoriamente las redes de citas observadas mientras preservamos las características clave del comportamiento de citas de científicos e inventores, incluida la cantidad de citas realizadas y recibidas por artículos y patentes individuales y la diferencia de edad entre las obras citadas y citadas. Encontramos que los valores de CD5 observados son más bajos que los de las redes simuladas (Datos extendidos Fig. 8c, f), y la brecha se está ampliando: con el tiempo, los documentos y las patentes son cada vez menos perjudiciales de lo que cabría esperar por casualidad. En conjunto, estos análisis adicionales indican que es poco probable que la disminución de CD5 se deba a cambios en las prácticas de publicación, citación o autoría.

También consideramos cómo la disminución de la perturbación se relaciona con el crecimiento del conocimiento (Datos ampliados Fig. 9). Por un lado, los científicos e inventores se enfrentan a una carga de conocimiento cada vez mayor, que puede inhibir los descubrimientos y las invenciones que alteran el statu quo. Por otro lado, como se señaló anteriormente, los filósofos de la ciencia sugieren que el conocimiento existente fomenta el descubrimiento y la invención3,6,7. Usando modelos de regresión, evaluamos la relación entre el stock de artículos y patentes (un indicador del conocimiento) dentro de los campos y su CD5 (Información complementaria, sección 3 y Tabla complementaria 2). Encontramos un efecto positivo del crecimiento del conocimiento sobre la disrupción de los artículos, en consonancia con trabajos previos20; sin embargo, encontramos un efecto negativo para las patentes.

Dados estos resultados contradictorios, consideramos la posibilidad de que la disponibilidad del conocimiento pueda diferir de su uso. En particular, el crecimiento de las publicaciones y las patentes puede llevar a los científicos e inventores a concentrarse en porciones más estrechas de trabajos anteriores18,46, lo que limita el acervo 'efectivo' de conocimiento. Usando tres proxies, documentamos una disminución en el uso del conocimiento previo entre científicos e inventores (Fig. 6). Primero, vemos una disminución en la diversidad del trabajo citado (Fig. 6a, d), lo que indica que la ciencia y la tecnología contemporáneas se están involucrando con porciones más estrechas del conocimiento existente. Además, esta disminución en la diversidad va acompañada de un aumento en la proporción de citas del 1% de los artículos y patentes más citados (Fig. 6a (i), d (i)), que también están disminuyendo en diversidad semántica (Fig. 6a (ii), d (ii)). Con el tiempo, los científicos e inventores citan cada vez más el mismo trabajo anterior, y ese trabajo anterior se está volviendo más similar en cuanto al tema. En segundo lugar, vemos un aumento en la autocitación (Fig. 6b, e), un indicador común de la continuación del flujo de investigación preexistente de uno47,48,49, lo cual es consistente con los científicos e inventores que confían más en conocimientos muy familiares. En tercer lugar, la edad media del trabajo citado, una medida común para el uso de conocimiento fechado50,51,52, está aumentando (Fig. 6c,f), lo que sugiere que los científicos e inventores pueden estar luchando para mantenerse al día con el ritmo de expansión del conocimiento. y en su lugar depender de un trabajo más antiguo y familiar. Los tres indicadores apuntan a una historia consistente: un alcance más limitado del conocimiento existente está informando el descubrimiento y la invención contemporáneos.

a–f, cambios en el nivel de diversidad del uso del conocimiento científico y tecnológico existente entre artículos (a, n = 264 áreas de investigación de WoS × año de observaciones; b y c, n = 24 659 076 artículos) y patentes (d, 229 categoría de tecnología NBER × año observaciones; e y f, n = 3,912,353 patentes) basado en las siguientes medidas: diversidad de trabajos citados (a y d), número medio de autocitas (b y e) y antigüedad media del trabajo citado (c y f) . Las bandas sombreadas (b, c, e y f) corresponden a intervalos de confianza del 95 %. Los gráficos insertados de a y d muestran los cambios en la proporción de citas al 1% de los artículos más citados (a(i) y d(i)) y en la diversidad semántica del 1% más citado a lo largo del tiempo (a (ii) yd (ii)). Los valores de ambas medidas se calculan dentro del campo y el año y, posteriormente, se promedian entre campos para el trazado. La diversidad semántica se basa en títulos de papel y patentes; los valores corresponden a la relación entre la desviación estándar y la similitud media del coseno por pares (es decir, el coeficiente de variación) entre los títulos del 1% de los artículos y patentes más citados por campo y año. Para permitir las comparaciones semánticas, los títulos se vectorizaron utilizando incrustaciones de palabras previamente entrenadas. Para artículos, se muestran líneas para cada área de investigación de WoS; para patentes, se muestran líneas para cada categoría de tecnología NBER. En análisis de regresión posteriores que utilizan estas medidas, encontramos que el uso de trabajos menos diversos, más trabajo propio y trabajo más antiguo se asocia con documentos y patentes menos disruptivos (métodos y datos ampliados, tabla 1).

Datos fuente

Los resultados de una serie posterior de modelos de regresión sugieren que el uso de trabajo menos diverso, más trabajo propio y trabajo más antiguo están asociados negativamente con la interrupción (Métodos, Tabla de datos ampliados 1 y Tabla complementaria 3), un patrón que se mantiene incluso después de contabilizar para la edad promedio y el número de trabajos anteriores producidos por los miembros del equipo. Cuando el rango de trabajo utilizado por científicos e inventores se estrecha, la actividad disruptiva disminuye.

En resumen, informamos una marcada disminución en la ciencia y la tecnología disruptivas a lo largo del tiempo. Nuestros análisis muestran que es poco probable que esta tendencia se deba a cambios en las prácticas de citación o la calidad del trabajo publicado. Más bien, el declive representa un cambio sustancial en la ciencia y la tecnología, que refuerza las preocupaciones sobre la desaceleración de la actividad innovadora. Atribuimos esta tendencia en parte a la confianza de los científicos e inventores en un conjunto más limitado de conocimientos existentes. Aunque los filósofos de la ciencia pueden tener razón en que el crecimiento del conocimiento es un proceso endógeno, en el que la comprensión acumulada promueve el descubrimiento y la invención futuros, es necesario relacionarse con una amplia gama de conocimientos existentes para que ese proceso se desarrolle, un requisito que parece más difícil. con tiempo. Confiar en porciones más estrechas de conocimiento beneficia las carreras individuales53, pero no el progreso científico en general.

Además, a pesar de que la prevalencia de trabajos disruptivos ha disminuido, encontramos que el número total se ha mantenido estable. Por un lado, este resultado puede sugerir que existe una 'capacidad de carga' fija para la ciencia y la tecnología altamente disruptivas, en cuyo caso, las intervenciones políticas destinadas a aumentar dicho trabajo pueden resultar desafiantes. Por otro lado, nuestra observación de una rotación considerable en los campos subyacentes responsables de producir ciencia y tecnología disruptivas sugiere la importancia potencial de factores tales como los intereses cambiantes de financiadores y científicos y la 'madurez' del conocimiento científico y tecnológico para los avances, en los que caso, la producción de trabajo disruptivo puede responder a palancas políticas. En cualquier caso, la estabilidad que observamos en la gran cantidad de documentos y patentes disruptivos sugiere que la ciencia y la tecnología no parecen haber llegado al final de la 'frontera sin fin'. Queda espacio para los desvíos regulares que las obras disruptivas aportan al progreso científico y tecnológico.

Nuestro estudio no está exento de limitaciones. En particular, aunque la investigación hasta la fecha respalda la validez del índice CD12,34, es un indicador relativamente nuevo de actividad innovadora y se beneficiará del trabajo futuro sobre su comportamiento y propiedades, especialmente en todas las fuentes de datos y contextos. Los estudios que examinen sistemáticamente el efecto de diferentes prácticas de citación54,55, que varían según los campos, serían particularmente informativos.

En general, nuestros resultados profundizan la comprensión de la evolución del conocimiento y pueden orientar la planificación profesional y la política científica. Para promover la ciencia y la tecnología disruptivas, se puede alentar a los académicos a leer mucho y darles tiempo para mantenerse al día con la frontera del conocimiento en rápida expansión. Las universidades pueden renunciar al enfoque en la cantidad y recompensar más fuertemente la calidad de la investigación56, y quizás subsidiar más completamente los años sabáticos. Las agencias federales pueden invertir en los premios individuales más riesgosos y a largo plazo que respaldan carreras y no simplemente proyectos específicos57, dando a los académicos el regalo del tiempo necesario para salir de la refriega, vacunarse de la cultura de publicar o morir y producir un trabajo verdaderamente importante. Comprender mejor el declive de la ciencia y la tecnología disruptivas permite un replanteamiento muy necesario de las estrategias para organizar la producción de ciencia y tecnología en el futuro.

Limitamos nuestro enfoque a los artículos de investigación publicados entre 1945 y 2010. Aunque los datos de WoS comienzan en el año 1900, la escala y la organización social de la ciencia cambiaron notablemente en la era de la posguerra, lo que hace que las comparaciones con el presente sean difíciles y potencialmente engañosas67, 68,69. Finalizamos nuestros análisis de artículos en 2010 porque algunas de nuestras medidas requieren varios años de datos posteriores a la publicación del artículo. Los datos de WoS archivan 65 millones de documentos publicados en 28 968 revistas entre 1900 y 2017 y 735 millones de citas entre ellos. Además, los datos de WoS incluyen los títulos y el texto completo de los resúmenes de 65 y 29 millones de registros, respectivamente, publicados entre 1913 y 2017. Después de eliminar los documentos que no son de investigación (por ejemplo, reseñas de libros y comentarios) y subdividir los datos en la ventana 1945-2010, la muestra analítica consta de n = 24.659.076 artículos.

Limitamos nuestro enfoque a las patentes otorgadas a partir de 1976, que es el primer año para el cual los registros legibles por máquina están disponibles en los datos de Patents View. Como hicimos con los artículos, terminamos nuestros análisis en 2010 porque algunas medidas requieren datos de años posteriores para su cálculo. Los datos de Patents View son la fuente más exhaustiva de datos históricos sobre invenciones, con información sobre 6,5 millones de patentes concedidas entre 1976 y 2017 y sus correspondientes 92 millones de citas. Los datos de Patents View incluyen los títulos y resúmenes de 6,5 millones de patentes otorgadas entre 1976 y 2017. Siguiendo el trabajo anterior12, centramos nuestra atención en las patentes de utilidad, que cubren la gran mayoría (91 % en nuestros datos) de las invenciones patentadas. Después de eliminar las patentes que no son de servicios públicos y subdividir los datos en la ventana de 1976 a 2010, la muestra analítica consiste en n = 3 912 353 patentes.

Las observaciones (y afirmaciones) sobre la desaceleración del progreso en ciencia y tecnología son cada vez más comunes, respaldadas no solo por la evidencia que reportamos, sino también por investigaciones previas desde diversas perspectivas metodológicas y disciplinarias10,11,18,19,20,21,22,23 ,24. Sin embargo, como se señala en el texto principal, existe una tensión entre las observaciones de la desaceleración del progreso a partir de datos agregados, por un lado, y los informes continuos de avances aparentemente importantes en muchos campos de la ciencia y la tecnología, que abarcan todo, desde la medición de las ondas de gravedad hasta la la secuenciación del genoma humano—por el otro. En un esfuerzo por reconciliar esta tensión, consideramos la posibilidad de que, si bien, en general, el descubrimiento y la invención pueden ser menos perturbadores con el tiempo, la visión de alto nivel adoptada en trabajos anteriores puede enmascarar una heterogeneidad considerable. Dicho de otra manera, la evidencia agregada de la desaceleración del progreso no excluye la posibilidad de que algún subconjunto de descubrimientos e invenciones sea altamente disruptivo.

Para evaluar esta posibilidad, trazamos el número de artículos disruptivos (Fig. 4a) y patentes (Fig. 4b) a lo largo del tiempo, donde los artículos disruptivos y las patentes se definen como aquellos con valores de CD5 >0. Dentro de cada panel, trazamos cuatro líneas, correspondientes a cuatro intervalos uniformemente espaciados ((0, 0,25], (0,25, 0,5], (0,5, 0,75], (0,75, 1,00)) sobre los valores positivos de CD5. Los dos primeros Por lo tanto, estos intervalos corresponden a artículos y patentes que son relativamente poco disruptivos, mientras que los dos últimos corresponden a aquellos que lo son más (por ejemplo, donde podemos esperar ver avances importantes como algunos de los mencionados anteriormente). la cantidad de artículos y patentes publicados cada año, vemos pocos cambios en la cantidad de artículos y patentes altamente disruptivos, como lo demuestran las líneas rojas, verdes y naranjas relativamente planas. En particular, esta 'conservación' del trabajo disruptivo se mantiene incluso a pesar de las fluctuaciones. con el tiempo en la composición de los campos científicos y tecnológicos responsables de producir el trabajo más disruptivo (Fig. 4, gráficos insertados). En general, estos resultados ayudan a explicar las observaciones simultáneas de los principales avances en muchos campos de la ciencia y la tecnología y agregan evidencia de una desaceleración del progreso.

Nuestros resultados muestran una disminución constante en la perturbación de la ciencia y la tecnología a lo largo del tiempo. Además, los patrones que observamos son generalmente similares en amplios campos de estudio, lo que sugiere que los factores que impulsan el declive no son exclusivos de dominios específicos de la ciencia y la tecnología. La disminución podría estar impulsada por otros factores, como las condiciones de la ciencia y la tecnología en un momento dado o las personas particulares que producen ciencia y tecnología. Por ejemplo, los factores exógenos, como las condiciones económicas, pueden fomentar prácticas de investigación o invención menos perjudiciales. De manera similar, los científicos e inventores de diferentes generaciones pueden tener diferentes enfoques, lo que puede resultar en mayores o menores tendencias para producir trabajo disruptivo. Por lo tanto, buscamos comprender la contribución relativa de los factores de campo, año y autor (o inventor) al declive de la ciencia y la tecnología disruptivas.

Para ello, descomponemos la contribución relativa de los efectos fijos de campo, año y autor al poder predictivo de los modelos de regresión del índice CD. La unidad de observación en estas regresiones es el autor (o inventor) × año. Ingresamos efectos fijos de campo utilizando indicadores de subcampo granulares (es decir, 150 áreas temáticas de WoS para artículos, 138 subcategorías de NBER para patentes). Para simplificar, no incluimos covariables adicionales más allá de los efectos fijos en nuestros modelos. Los efectos fijos de campo capturan todos los factores específicos del campo que no varían por autor o año (por ejemplo, el tema básico); los efectos fijos de año capturan todos los factores específicos del año que no varían según el campo o el autor (por ejemplo, el estado de la tecnología de la comunicación); Los efectos fijos de autor (o inventor) capturan todos los factores específicos del autor que no varían según el campo o el año (por ejemplo, el año de concesión del doctorado). Después de especificar nuestro modelo, determinamos la contribución relativa de los efectos fijos de campo, año y autor al R2 ajustado del modelo general utilizando la descomposición de Shapley-Owen. Específicamente, dados nuestros n = 3 grupos de efectos fijos (campo, año y autor), evaluamos la contribución relativa de cada conjunto de efectos fijos estimando el R2 ajustado por separado para los modelos 2n utilizando subconjuntos de predictores. La contribución relativa de cada conjunto de efectos fijos se calcula luego utilizando el valor de Shapley de la teoría de juegos70.

Los resultados de este análisis se muestran en la Fig. 5 de datos ampliados, tanto para artículos (barra superior) como para patentes (barra inferior). El tamaño total de la barra corresponde al valor del R2 ajustado para el modelo completamente especificado (es decir, con los tres grupos de efectos fijos). De acuerdo con nuestras observaciones de los gráficos del índice CD a lo largo del tiempo, observamos que tanto para artículos como para patentes, los factores específicos del campo hacen la contribución relativa más baja al R2 ajustado (0,02 y 0,01 para artículos y patentes, respectivamente). Los efectos fijos de autor, por el contrario, parecen contribuir mucho más al poder predictivo del modelo, tanto para artículos (0,20) como para patentes (0,17). Los investigadores e inventores que ingresaron al campo en años más recientes pueden enfrentar una mayor carga de conocimiento y, por lo tanto, recurrir a construir sobre partes más estrechas del trabajo existente (por ejemplo, debido a una formación de doctorado más especializada), lo que generalmente conduciría a una ciencia menos disruptiva. tecnología que se está produciendo en años posteriores, en consonancia con nuestros hallazgos. El patrón es más complejo para los efectos fijos anuales; aunque los factores específicos del año que no varían según el campo o el autor tienen más poder explicativo que el campo tanto para los artículos (0,02) como para las patentes (0,16), parecen ser sustancialmente más importantes para las últimas que para las primeras. En conjunto, estos hallazgos sugieren que los factores relativamente estables que varían entre científicos e inventores individuales pueden ser particularmente importantes para comprender los cambios en la perturbación a lo largo del tiempo. Los resultados también confirman que los factores específicos de dominio en los campos de la ciencia y la tecnología juegan un papel muy pequeño en la explicación de la disminución de la perturbación de los artículos y las patentes.

También consideramos si los patrones que documentamos pueden ser artefactos de nuestra elección de fuentes de datos. Aunque observamos tendencias constantes en los datos de WoS y Patents View, y ambas bases de datos son ampliamente utilizadas por la comunidad de Ciencias de la Ciencia, es posible que nuestros resultados se deban a factores como cambios en la cobertura (por ejemplo, revistas agregadas o excluidas de WoS con el tiempo) o incluso errores de datos en lugar de cambios fundamentales en la ciencia y la tecnología. Para evaluar esta posibilidad, calculamos el CD5 para artículos en cuatro bases de datos adicionales: JSTOR, el corpus de la American Physical Society, Microsoft Academic Graph y PubMed. Incluimos todos los registros desde 1930 hasta 2010 de PubMed (16 774 282 artículos), JSTOR (1 703 353 artículos) y American Physical Society (478 373 artículos). Los datos de JSTOR se obtuvieron a través de una solicitud especial de ITHAKA, el mantenedor de datos (http://www.ithaka.org), al igual que los datos de la American Physical Society (https://journals.aps.org/datasets). Descargamos los datos de Microsoft Academic Graph de CADRE en la Universidad de Indiana (https://cadre.iu.edu/). Los datos de PubMed se descargaron del servidor FTP de la Biblioteca Nacional de Medicina (ftp://ftp.ncbi.nlm.nih.gov/pubmed/baseline). Debido a la escala excepcionalmente grande de Microsoft Academic Graph y la carga computacional asociada, extrajimos aleatoriamente 1 millón de documentos. Como se muestra en la Fig. 6 de datos ampliados, la tendencia a la baja en la perturbación es evidente en todas las muestras.

Varios trabajos recientes han introducido especificaciones alternativas del índice de CD12. Evaluamos si las disminuciones en la perturbación que observamos se corroboran utilizando dos variaciones alternativas. Una crítica al índice de CD ha sido que la cantidad de artículos que citan solo las referencias del artículo principal domina la medida13. Bornmann et al.13 propone \({{\rm{DI}}}_{l}^{{\rm{nok}}}\) como una variante menos susceptible a este problema. Otra debilidad potencial del índice CD es que podría ser muy sensible a pequeños cambios en los patrones de citas hacia adelante de los artículos que no hacen citas hacia atrás15. Leydesdorff et al.15 sugiere DI* como un indicador alternativo de interrupción que aborda este problema. Por lo tanto, calculamos \({{\rm{DI}}}_{l}^{{\rm{nok}}}\) donde l = 5 y DI* para 100 000 documentos y patentes seleccionados al azar de nuestra muestra analítica. . Los resultados se presentan en Datos ampliados Fig. 7a (artículos) yb (patentes). Las líneas azules indican disrupción basada en Bornmann et al.13 y las líneas naranjas indican disrupción basada en Leydesdorff et al.15. En ciencia y tecnología, las dos medidas alternativas muestran disminuciones en la interrupción a lo largo del tiempo, similares a los patrones observados con el índice CD. En conjunto, estos resultados sugieren que las disminuciones en la disrupción que documentamos no son un artefacto de nuestra operacionalización particular.

También consideramos si nuestros resultados pueden atribuirse a cambios en las prácticas de publicación, citación o autoría, en lugar de cambios sustanciales en el descubrimiento y la invención. Quizás lo más crítico, como se señala en el texto principal, ha sido una marcada expansión en la publicación y las patentes durante el período de nuestro estudio. Esta expansión naturalmente ha incrementado la cantidad de trabajos previos que son relevantes para la ciencia y la tecnología actuales y, por lo tanto, corren el riesgo de ser citados, un patrón que se refleja en el marcado aumento en el número promedio de citas realizadas por artículos y patentes (es decir, artículos y las patentes citan más trabajos anteriores que en épocas anteriores)44,45. Recuerde que el índice de CD cuantifica el grado en que el trabajo futuro cita un trabajo focal junto con sus predecesores (es decir, las referencias en la bibliografía del trabajo focal). Una mayor citación de un trabajo focal independientemente de sus predecesores se toma como evidencia de un proceso social de ruptura. Sin embargo, a medida que los artículos y las patentes citan más trabajos anteriores, la probabilidad de que un trabajo central sea citado independientemente de sus predecesores puede disminuir mecánicamente; cuantas más citas haga un trabajo focal, más probable es que un trabajo futuro lo cite junto con uno de sus predecesores, incluso por casualidad. En consecuencia, los aumentos en el número de artículos y patentes disponibles para citar y en el número promedio de citas realizadas por científicos e inventores pueden contribuir a la disminución de los valores del índice CD. En resumen, dados los marcados cambios en la ciencia y la tecnología durante nuestra larga ventana de estudio, el índice de CD de artículos y patentes publicados en períodos anteriores puede no ser directamente comparable con los de época más reciente, lo que a su vez podría hacer que nuestras conclusiones sobre la disminución en ciencia disruptiva y tecnología sospechosa. Abordamos estas preocupaciones utilizando tres enfoques distintivos pero complementarios: normalización, ajuste de regresión y simulación.

Primero, siguiendo la práctica común en la investigación bibliométrica39,40,41,42,43, desarrollamos dos versiones normalizadas del índice CD, con el objetivo de facilitar las comparaciones a lo largo del tiempo. Entre los diversos componentes del índice de CD, enfocamos nuestra atención en el conteo de artículos o patentes que solo citan las referencias del trabajo focal (Nk), ya que este término parece más probable que aumente con los aumentos en publicaciones y patentes y en el número medio de citas realizadas por artículos y patentes a trabajos anteriores13. Los valores más grandes de Nk conducen a valores más pequeños del índice CD. En consecuencia, los aumentos marcados en Nk a lo largo del tiempo, particularmente en relación con otros componentes de la medida, pueden conducir a un sesgo a la baja, lo que inhibe nuestra capacidad para comparar con precisión la ciencia y la tecnología disruptivas en años posteriores con períodos anteriores.

Nuestras dos versiones normalizadas del índice CD tienen como objetivo abordar este sesgo potencial al atenuar el efecto de los aumentos en Nk. En la primera versión, que llamamos 'Paper normalized', restamos de Nk el número de citas hechas por el paper focal o patente al trabajo anterior (Nb). La intuición detrás de este ajuste es que cuando un artículo focal o una patente citan más trabajos anteriores, es probable que Nk sea más grande porque hay más oportunidades para que el trabajo futuro cite los predecesores de la patente o el artículo focal. Este aumento en Nk daría como resultado valores más bajos del índice CD, aunque no necesariamente como resultado de que el artículo o patente focal sea menos perturbador. En la segunda versión, que llamamos 'campo × año normalizado', restamos Nk por el número promedio de citas hacia atrás hechas por artículos o patentes en el área de investigación de WoS de artículo focal o patente o categoría de tecnología NBER, respectivamente, durante su año de publicación (etiquetamos esta cantidad como \({N}_{{\rm{b}}}^{{\rm{m}}{\rm{e}}{\rm{a}}{\rm{n} }}\)). La intuición detrás de este ajuste es que en los campos y períodos de tiempo en los que existe una mayor tendencia de los científicos e inventores a citar trabajos anteriores, es probable que Nk también sea mayor, lo que conduce a valores más bajos del índice CD, aunque de nuevo no necesariamente. como resultado de que el documento focal o la patente sean menos perjudiciales. En los casos en que Nb o \({N}_{{\rm{b}}}^{{\rm{m}}{\rm{e}}{\rm{a}}{\rm{n }}}\) superan el valor de Nk, establecemos Nk en 0 (es decir, Nk nunca es negativo en las medidas normalizadas). Ambas adaptaciones del índice CD están inspiradas en enfoques establecidos en la literatura de cienciometría, y pueden entenderse como una forma de 'normalización del lado de la cita' (es decir, normalización mediante la corrección del efecto de las diferencias en la longitud de las listas de referencias)40.

En la figura 8 de datos ampliados, trazamos los valores promedio de ambas versiones normalizadas del índice de CD a lo largo del tiempo, por separado para artículos (figura 8a de datos ampliados) y patentes (figura 8d de datos ampliados). De acuerdo con nuestros hallazgos informados en el texto principal, seguimos observando una disminución en el índice de CD a lo largo del tiempo, lo que sugiere que es poco probable que los patrones que observamos en la ciencia y la tecnología disruptivas sean impulsados ​​​​por cambios en las prácticas de citación.

En segundo lugar, ajustamos por posibles factores de confusión utilizando un enfoque basado en regresión. Este enfoque complementa las normalizaciones bibliométricas que acabamos de describir al permitirnos dar cuenta de una gama más amplia de cambios en las prácticas de publicación, citación y autoría en general (el último de los cuales no se tiene en cuenta directamente ni en el enfoque de normalización ni en el enfoque de simulación que se describe a continuación). , y aumenta la cantidad de trabajo previo que es relevante para la ciencia y la tecnología actuales en particular. En la Tabla complementaria 1, informamos los resultados de los modelos de regresión que predicen CD5 para artículos (Modelos 1 a 4) y patentes (Modelos 5 a 8), con variables indicadoras incluidas para cada año de nuestra ventana de estudio (las categorías de referencia son 1945 y 1980). para artículos y patentes, respectivamente). Los modelos 1 y 4 son los modelos de referencia y no incluyen otros ajustes más allá de los indicadores anuales. En los modelos 2 y 5, agregamos efectos fijos de subcampo (áreas temáticas WoS para artículos y subcategorías de tecnología NBER para patentes). Finalmente, en los Modelos 3–4 y 7–8, agregamos variables de control para varios niveles de campo × año: número de artículos nuevos o patentes, número medio de artículos o patentes citados, número medio de autores o inventores por artículo y artículos o artículos. nivel de patente (número de artículos o patentes citados) características, lo que permite comparaciones más sólidas en los patrones de ciencia y tecnología disruptivas durante el largo período de tiempo que abarca nuestro estudio. Para los modelos en papel, también incluimos un control a nivel de papel para el número de referencias no vinculadas (es decir, el número de citas de trabajos que no están indexados en WoS). Encontramos que la inclusión de estos controles mejora el ajuste del modelo, como lo indican las pruebas de Wald estadísticamente significativas que se presentan debajo de los modelos relevantes.

En los ocho modelos que se muestran en la Tabla complementaria 1, encontramos que los coeficientes de los indicadores anuales son estadísticamente significativos y negativos, y aumentan en magnitud con el tiempo, lo que es consistente con los patrones que informamos en función del índice de valores de CD5 no ajustado en el texto principal. (Figura 2). En la Fig. 8 de datos ampliados, visualizamos los resultados de nuestro enfoque basado en la regresión trazando los valores de CD5 pronosticados por separado para cada uno de los indicadores de año incluidos en los modelos 4 (documentos) y 8 (patentes). Para permitir las comparaciones con los valores brutos de CD5 que se muestran en el texto principal, presentamos las predicciones separadas hechas para cada año como un gráfico de líneas. Como se muestra en la figura, seguimos observando valores decrecientes del índice CD en artículos y patentes, incluso cuando se tienen en cuenta los cambios en las prácticas de publicación, citación y autoría.

En tercer lugar, siguiendo un trabajo relacionado en Science of Science14,71,72,73, consideramos si nuestros resultados pueden ser un artefacto del cambio de patrones en las prácticas de publicación y citación mediante el uso de un enfoque de simulación. En esencia, el índice de CD mide la disrupción al caracterizar la red de citas en torno a un documento o patente focal. Sin embargo, muchas redes complejas, incluso las que resultan de procesos aleatorios, exhiben estructuras que producen valores no triviales en medidas de red comunes (por ejemplo, agrupamiento)74,75,76. Durante el período que abarca nuestro estudio, las redes de citas de ciencia y tecnología experimentaron un cambio significativo, con aumentos marcados tanto en el número de nodos (es decir, artículos o patentes) como en los bordes (es decir, citas). Por lo tanto, en lugar de reflejar un proceso social significativo, las disminuciones observadas en la disrupción pueden resultar de estos cambios estructurales en las redes de citas subyacentes.

Para evaluar esta posibilidad, seguimos técnicas estándar de la ciencia de redes75,77 y realizamos un análisis en el que volvimos a calcular el índice de CD en redes de citas reconectadas aleatoriamente. Si los patrones que observamos en el índice de CD son el resultado de cambios estructurales en las redes de citas de ciencia y tecnología (por ejemplo, el crecimiento en el número de nodos o aristas) en lugar de un proceso social significativo, entonces estos patrones también deberían ser visibles. en redes aleatorias comparables que experimentan cambios estructurales similares. Por lo tanto, encontrar que los patrones que vemos en el índice de CD difieren para las redes de citas observadas y aleatorias serviría como evidencia de que la disminución en la interrupción no es un artefacto de los datos.

Comenzamos creando copias de la red de citas subyacente en la que se basaron los valores del índice CD utilizados en todos los análisis informados en el texto principal, por separado para artículos y patentes. Para cada red de citas (una para artículos, otra para patentes), luego reconfiguramos las citas utilizando un algoritmo de aleatorización que preserva el grado. En cada iteración del algoritmo, se seleccionan dos aristas (por ejemplo, A–B y C–D) de la red de citas subyacente, después de lo cual el algoritmo intenta intercambiar los dos extremos de las aristas (por ejemplo, A–B se convierte en A–D, y C–D se convierte en C–B). Si el grado de centralidad de A, B, C y D permanece igual después del canje, el canje se mantiene; de lo contrario, el algoritmo descarta el intercambio y pasa a la siguiente iteración. Cuando evaluamos la centralidad del grado, consideramos 'en el grado' (es decir, citas de otros artículos o patentes al artículo o patente principal) y 'fuera del título' (es decir, citas del artículo principal o patente a otros artículos o patentes). patentes) por separado. Además, también exigimos que la distribución por edades de los documentos o patentes citados y citados fuera idéntica en las redes originales y reconectadas. Específicamente, los intercambios solo se retuvieron cuando el año de publicación de las citas original y candidata era el mismo. A la luz de estas opciones de diseño, nuestro algoritmo de recableado debe verse como bastante conservador, ya que conserva una estructura sustancial de la red original. No existe un consenso académico sobre la cantidad de intercambios necesarios para garantizar que las redes originales y recableadas sean lo suficientemente diferentes entre sí; la regla que adoptamos aquí es 100 × m, donde m es el número de aristas en la red que se está reconectando.

Siguiendo el trabajo previo14, creamos diez copias recableadas de las redes de citas observadas tanto para artículos como para patentes. Después de crear estas redes de citas reconectadas, volvimos a calcular CD5. Debido a la gran escala de los datos de WoS, basamos nuestros análisis en una submuestra aleatoria de diez millones de artículos; CD5 se calculó en la red recableada para todas las patentes. Para cada artículo y patente, luego calculamos una puntuación z que compara el valor de CD5 observado con los del mismo artículo o patente en las diez redes de citas reconectadas. Las puntuaciones z positivas indican que el valor de CD5 observado es mayor (es decir, más perturbador) de lo que cabría esperar por casualidad; Las puntuaciones z negativas indican que los valores observados son menores (es decir, más consolidados).

Los resultados de estos análisis se muestran en la figura 8 de datos ampliados, por separado para artículos (figura 8c de datos ampliados) y patentes (figura 8f de datos ampliados). Las líneas corresponden al puntaje z promedio entre los artículos o patentes publicados en el año focal. Las gráficas revelan un patrón de cambio en el índice de CD más allá de lo que se 'incorporó' a la estructura cambiante de la red. Encontramos que, en promedio, los documentos y las patentes tienden a ser menos perturbadores de lo que se esperaría por casualidad y, además, la brecha entre los valores del índice de CD observados y los de las redes recableadas aleatoriamente aumenta con el tiempo, lo cual es consistente con nuestros hallazgos. de un declive en la ciencia y la tecnología disruptivas.

Tomados en conjunto, los resultados de los análisis anteriores sugieren que, aunque ha habido cambios marcados en la ciencia y la tecnología en el transcurso de nuestra larga ventana de estudio, particularmente con respecto a las prácticas de publicación, citación y autoría, la disminución de la ciencia y la tecnología disruptivas que Es poco probable que el documento que utiliza el índice de CD sea un artefacto de estos cambios y, en cambio, representa un cambio sustancial en la naturaleza del descubrimiento y la invención.

Evaluamos la relación entre la perturbación y el uso de conocimientos previos utilizando modelos de regresión, prediciendo CD5 para artículos y patentes individuales, en función de tres indicadores de uso de conocimientos previos: la diversidad de trabajos citados, el número medio de autocitas y la edad media del trabajo. citado. Nuestra medida de la diversidad del trabajo citado se mide a nivel de campo × año; todas las demás variables incluidas en las regresiones se definen a nivel del artículo o patente. Para tener en cuenta los posibles factores de confusión, nuestros modelos incluyeron efectos fijos de año y de campo. Los efectos fijos por año representan los factores variables en el tiempo que afectan todas las observaciones (artículos o patentes) por igual (por ejemplo, las tendencias económicas mundiales). Los efectos fijos de campo representan factores específicos del campo que no cambian con el tiempo (por ejemplo, algunos campos pueden valorar intrínsecamente el trabajo disruptivo sobre los de consolidación). En contraste con nuestras gráficas descriptivas, para nuestros modelos de regresión, ajustamos los efectos de campo usando las 'temas extendidas' más granulares de 150 WoS (por ejemplo, 'bioquímica y biología molecular', 'biofísica', 'biotecnología y microbiología aplicada', ' biología celular', 'biología del desarrollo', 'biología evolutiva' y 'microbiología' son temas extendidos dentro del área de investigación de ciencias de la vida y biomedicina) y 38 subcategorías de tecnología NBER (por ejemplo, 'agricultura', 'alimentos', 'textil'; 'revestimiento', 'gas', 'orgánico' y 'resinas' son subcategorías dentro de la categoría de tecnología química).

Además, también incluimos controles para la 'edad media de los miembros del equipo' (es decir, 'edad de carrera', definida como la diferencia entre el año de publicación del artículo o patente focal y el primer año en el que cada autor o inventor publicó un artículo o una patente) y el 'número medio de trabajos anteriores producidos por los miembros del equipo'. Aunque los aumentos en las tasas de autocitas pueden indicar que los científicos e inventores se están centrando cada vez más en su propio trabajo, estas tasas también pueden deberse en parte a la cantidad de trabajos anteriores disponibles para autocitas. Del mismo modo, aunque los aumentos en la antigüedad laboral citados en artículos y patentes pueden indicar que los científicos e inventores luchan por mantenerse al día, también pueden estar motivados por el rápido envejecimiento de la fuerza laboral en ciencia y tecnología78,79. Por ejemplo, los científicos e inventores mayores pueden estar más familiarizados o más atentos al trabajo anterior, o pueden resistirse activamente al cambio80. Estas variables de control ayudan a dar cuenta de estas explicaciones alternativas.

La Tabla complementaria 3 muestra las estadísticas de resumen de las variables utilizadas en los modelos de regresión de mínimos cuadrados ordinarios. La diversidad del trabajo citado se mide por la entropía normalizada, que varía de 0 a 1. Los valores más altos de esta medida indican una distribución más uniforme de las citas a una gama más amplia de trabajo existente; los valores más bajos indican una distribución más concentrada de citas a un rango más pequeño de trabajo existente. Las tablas muestran que la entropía normalizada en un campo y año determinados tiene una entropía promedio casi máxima de 0,98 tanto para la ciencia como para la tecnología. Alrededor del 16% de los artículos citados en un artículo son de un autor del artículo principal; el número correspondiente a las patentes es de alrededor del 7%. Los documentos tienden a basarse en trabajos más antiguos y trabajos que varían mucho más en edad (medida por la desviación estándar) que las patentes. Además, el CD5 promedio de un artículo es 0,04, mientras que el CD5 promedio de una patente es 0,12, lo que significa que el artículo promedio tiende a ser menos perturbador que la patente promedio.

Encontramos que usar un trabajo más diverso, menos trabajo propio y trabajo más antiguo tiende a asociarse con la producción de ciencia y tecnología más disruptiva, incluso después de tener en cuenta la edad promedio y la cantidad de trabajos anteriores producidos por los miembros del equipo. Estos hallazgos se basan en nuestros resultados de regresión, que se muestran en la Tabla 1 de datos ampliados. Los modelos 6 y 12 presentan los modelos de regresión completos. Los modelos indican un patrón consistente tanto para ciencia como para tecnología, donde los coeficientes de diversidad de trabajo citados son positivos y significativos para artículos (0.159, P < 0.01) y patentes (0.069, P < 0.01), lo que indica que en campos en los que existe A mayor uso de trabajo diverso, mayor disrupción. Manteniendo todas las demás variables en sus medias, el CD5 previsto de artículos y patentes aumenta en un 303,5 % y un 1,3 %, respectivamente, cuando la diversidad de trabajos citados aumenta en 1 sd Los coeficientes de la proporción de autocitas respecto al trabajo total citado son negativos y significativo para artículos (−0,011, P < 0,01) y patentes (−0,060, P < 0,01), lo que demuestra que cuando los investigadores o inventores confían más en su propio trabajo, el descubrimiento y la invención tienden a ser menos perturbadores. De nuevo, manteniendo todas las demás variables en sus medias, el CD5 previsto de documentos y patentes disminuye en un 622,9 % y un 18,5 %, respectivamente, con un aumento de 1 sd en la proporción. Los coeficientes de la interacción entre la antigüedad media de la obra citada y la dispersión en la antigüedad de la obra citada son positivos y significativos para artículos (0,000, P < 0,01) y patentes (0,001, P < 0,01), lo que sugiere que, manteniendo la dispersión de la antigüedad de trabajo citado constante: es más probable que los documentos y patentes que se relacionan con trabajos más antiguos sean disruptivos. El CD5 previsto de artículos y patentes aumenta en un sorprendente 2.072,4 % y 58,4 %, respectivamente, cuando la edad media del trabajo citado aumenta en 1 sd (alrededor de nueve y ocho años para artículos y patentes, respectivamente), manteniendo todas las demás variables en sus medios. En resumen, los resultados de la regresión sugieren que los cambios en el uso del conocimiento previo pueden contribuir a la producción de ciencia y tecnología menos disruptivas.

Más información sobre el diseño de la investigación está disponible en el Resumen de informes de Nature Portfolio vinculado a este artículo.

Los datos asociados con este estudio están disponibles gratuitamente en un repositorio público en https://doi.org/10.5281/zenodo.7258379. Nuestro estudio se basa en datos de seis fuentes: American Physical Society, JSTOR, Microsoft Academic Graph, Patents View, PubMed y WoS. Los datos de Microsoft Academic Graph, Patents View y PubMed están disponibles públicamente, y nuestro repositorio incluye datos completos para análisis de estas fuentes. Los datos de la American Physical Society, JSTOR y WoS no están disponibles públicamente y se usaron bajo licencia de sus respectivos editores. Para facilitar la replicación, nuestro repositorio incluye versiones limitadas de los datos de estas fuentes, lo que permitirá el cálculo de estadísticas descriptivas básicas. Los autores pondrán a disposición versiones completas de estos datos previa solicitud y con el permiso de sus respectivos editores. Los datos de origen se proporcionan con este documento.

El código fuente abierto relacionado con este estudio está disponible en https://doi.org/10.5281/zenodo.7258379 y http://www.cdindex.info. Usamos Python v.3.10.6 (pandas v.1.4.3, numpy v.1.23.1, matplotlib v.3.5.2, seaborn v.0.11.2, spacy v.2.2, jupyterlab v.3.4.4) para disputar, analizar y visualizar datos y realizar análisis estadísticos. Usamos MariaDB v.10.6.4 para disputar datos. Usamos R v.4.2.1 (ggplot2 v.3.36, ggrepel v.0.9.0) para visualizar datos. Utilizamos StataMP v.17.0 (reghdfe v.5.7.3) para realizar análisis estadísticos.

Fleming, L. Incertidumbre recombinante en la búsqueda tecnológica. Administrar. ciencia 47, 117–132 (2001).

Artículo Google Académico

Schumpeter, J. Capitalismo, Socialismo y Democracia (Perennial, 1942).

Koyré, A. Una carta inédita de Robert Hooke a Isaac Newton. ISIS 43, 312–337 (1952).

Artículo MathSciNet MATEMÁTICAS Google Académico

Popper, K. Conjeturas y refutaciones: el crecimiento del conocimiento científico (Routledge, 2014).

Fleck, L. Génesis y desarrollo de un hecho científico (Univ. Chicago Press, 2012).

Acemoglu, D., Akcigit, U. & Kerr, WR Red de innovación. proc. Academia Nacional. ciencia EE. UU. 113, 11483–11488 (2016).

Artículo ADS CAS Google Académico

Weitzman, ML Crecimiento recombinante. Economía QJ. 113, 331–360 (1998).

Artículo MathSciNet MATEMÁTICAS Google Académico

Tria, F., Loreto, V., Servedio, VDP & Strogatz, SH La dinámica de las novedades correlacionadas. ciencia Rep. 4, 1–8 (2014).

Artículo Google Académico

Fink, TMA, Reeves, M., Palma, R. & Farr, RS Serendipity y estrategia en la innovación rápida. Nat. común 8, 1–9 (2017).

Artículo CAS Google Académico

Pammolli, F., Magazzini, L. & Riccaboni, M. La crisis de productividad en la I+D farmacéutica. Nat. Rev. Descubrimiento de Drogas. 10, 428–438 (2011).

Artículo CAS Google Académico

Bloom, N., Jones, CI, Van Reenen, J. & Webb, M. ¿Se están volviendo más difíciles de encontrar las ideas? Soy. economía Rev. 110, 1104–1144 (2020).

Artículo Google Académico

Funk, RJ & Owen-Smith, J. Una medida de red dinámica del cambio tecnológico. Administrar. ciencia 63, 791–817 (2017).

Artículo Google Académico

Bornmann, L., Devarakonda, S., Tekles, A. & Chacko, G. ¿Son los indicadores del índice de disrupción convergentemente válidos? La comparación de varias variantes de indicadores con evaluaciones por pares. cuant. ciencia Semental. 1, 1242–1259 (2020).

Artículo Google Académico

Uzzi, B., Mukherjee, S., Stringer, M. & Jones, B. Combinaciones atípicas e impacto científico. Ciencia 342, 468–472 (2013).

Artículo ADS CAS Google Académico

Leydesdorff, L., Tekles, A. & Bornmann, L. Una propuesta para revisar el índice de disrupción. Profesor Inf. 30, e300121 (2021).

Lu, C. et al. Analizar la complejidad lingüística y el impacto científico. J. Informetr. 13, 817–829 (2019).

Artículo Google Académico

Hofstra, B. et al. La paradoja diversidad-innovación en la ciencia. proc. Academia Nacional. ciencia EE. UU. 117, 9284–9291 (2020).

Artículo ADS CAS Google Académico

Jones, BF La carga del conocimiento y la 'muerte del hombre del renacimiento': ¿la innovación es cada vez más difícil? Rev. Econ. Semental. 76, 283–317 (2009).

Artículo MATEMÁTICAS Google Académico

Gordon, RJ El ascenso y la caída del crecimiento estadounidense (Princeton Univ. Press, 2016).

Chu, JSG & Evans, JA Ralentización del progreso canónico en grandes campos de la ciencia. proc. Academia Nacional. ciencia EE. UU. 118, e2021636118 (2021).

Artículo CAS Google Académico

Packalen, M. & Bhattacharya, J. Financiamiento del NIH y la búsqueda de la ciencia de vanguardia. proc. Academia Nacional. ciencia EE. UU. 117, 12011–12016 (2020).

Artículo ADS CAS Google Académico

Jaffe, AB & Lerner, J. La innovación y sus descontentos: cómo nuestro sistema de patentes roto está poniendo en peligro la innovación y el progreso, y qué hacer al respecto (Princeton Univ. Press, 2011).

Horgan, J. El fin de la ciencia: Enfrentando los límites del conocimiento en el crepúsculo de la era científica (Basic Books, 2015).

Collison, P. & Nielsen, M. Science Is Getting Less Bang for its Buck (Atlántico, 2018).

Nolan, A. La inteligencia artificial y el futuro de la ciencia. oecd.ai, https://oecd.ai/en/wonk/ai-future-of-science (25 de octubre de 2021).

Políticas efectivas para fomentar la investigación de alto riesgo/alta recompensa. Documentos de política de ciencia, tecnología e industria de la OCDE (OCDE, 2021).

Cowen, T. El gran estancamiento: cómo Estados Unidos se comió toda la fruta madura de la historia moderna, se enfermó y (eventualmente) se sentirá mejor (Penguin, 2011).

Einstein, A. El mundo tal como lo veo (Citadel Press, 1949).

Arthur, WB La estructura de la invención. Res. Política 36, ​​274–287 (2007).

Artículo Google Académico

Tushman, ML & Anderson, P. Discontinuidades tecnológicas y entornos organizacionales. ciencia adm. P. 31, 439–465 (1986).

Artículo Google Académico

Kohn, W. & Sham, LJ Ecuaciones autoconsistentes que incluyen efectos de intercambio y correlación. física Rev. 140, A1133 (1965).

Artículo ADS MathSciNet Google Scholar

Watson, JD & Crick, FHC Estructura molecular de los ácidos nucleicos: una estructura para el ácido nucleico de desoxirribosa. Naturaleza 171, 737–738 (1953).

Artículo ADS CAS Google Académico

Bornmann, L. & Tekles, A. El índice de interrupción depende de la duración de la ventana de citas. Profesor Inf. 28, e280207 (2019).

Wu, L., Wang, D. & Evans, JA Los equipos grandes desarrollan y los equipos pequeños interrumpen la ciencia y la tecnología. Naturaleza 566, 378–382 (2019).

Artículo ADS CAS Google Académico

Kuhn, TS La estructura de las revoluciones científicas (Univ. Chicago Press, 1962).

Brad Wray, K. Kuhn y el descubrimiento de paradigmas. Filosofía Soc. ciencia 41, 380–397 (2011).

Artículo Google Académico

Ioannidis, JPA Por qué la mayoría de los hallazgos de investigación publicados son falsos. PLoS Med. 2, e124 (2005).

Artículo Google Académico

Li, J., Yin, Y., Fortunato, S. & Wang, D. Un conjunto de datos de registros de publicación de premios Nobel. ciencia Datos 6, 1–10 (2019).

Artículo Google Académico

Bornmann, L. & Marx, W. Métodos para la generación de puntajes de impacto de citas normalizados en bibliometría: ¿qué método refleja mejor los juicios de los expertos? J. Informetr. 9, 408–418 (2015).

Artículo Google Académico

Waltman, L. Una revisión de la literatura sobre indicadores de impacto de citas. J. Informetr. 10, 365–391 (2016).

Artículo Google Académico

Waltman, L. & van Eck, NJ en Springer Handbook of Science and Technology Indicators (eds. Glänzel, W. et al.) 281–300 (Springer, 2019).

Bornmann, L. ¿Cómo se puede normalizar el impacto de las citas en la bibliometría? Un nuevo enfoque que combina la normalización del lado de las citas y los percentiles de citas. cuant. ciencia Semental. 1, 1553-1569 (2020).

Artículo Google Académico

Petersen, AM, Pan, RK, Pammolli, F. & Fortunato, S. Métodos para dar cuenta de la inflación de citas en la evaluación de la investigación. Res. Política 48, 1855–1865 (2019).

Artículo Google Académico

Bornmann, L. & Mutz, R. Tasas de crecimiento de la ciencia moderna: un análisis bibliométrico basado en el número de publicaciones y referencias citadas. J. Asociado. información ciencia Tecnología 66, 2215–2222 (2015).

Artículo CAS Google Académico

Bornmann, L., Haunschild, R. & Mutz, R. Tasas de crecimiento de la ciencia moderna: un enfoque de curva de crecimiento por partes latente para modelar números de publicación de bases de datos de literatura nueva y establecida. Humanidad Soc. ciencia común 8, 1–15 (2021).

Artículo Google Académico

Jones, BF & Weinberg, BA Dinámica de la edad en la creatividad científica. proc. Academia Nacional. ciencia EE. UU. 108, 18910–18914 (2011).

Artículo ADS CAS Google Académico

Bonzi, S. & Snyder, H. Motivaciones para la citación: una comparación de la autocitación y la citación a otros. Cienciometría 21, 245–254 (1991).

Artículo Google Académico

Fowler, J. & Aksnes, D. ¿Paga la autocitación? Cienciometría 72, 427–437 (2007).

Artículo Google Académico

King, MM, Bergstrom, CT, Correll, SJ, Jacquet, J. & West, JD Los hombres establecen sus propias citas en alto: género y autocitación en todos los campos y a lo largo del tiempo. Socio 3, 2378023117738903 (2017).

Artículo Google Académico

Mukherjee, S., Romero, DM, Jones, B. & Uzzi, B. El vínculo casi universal entre la era del conocimiento pasado y los avances científicos y tecnológicos del mañana: el punto de acceso. ciencia Adv. 3, e1601315 (2017).

Artículo ANUNCIOS Google Académico

Merton, RK Singletons y múltiples en el descubrimiento científico: un capítulo en la sociología de la ciencia. proc. Soy. Filosofía Soc. 105, 470–486 (1961).

Google Académico

Wang, D., Song, C. y Barabási, A.-L. Cuantificación del impacto científico a largo plazo. Ciencia 342, 127–132 (2013).

Artículo ADS CAS Google Académico

Leahey, E. No solo por la productividad: cómo la visibilidad y la especialización contribuyen a los ingresos académicos. Soy. Sociol. Rev. 72, 533–561 (2007).

Artículo Google Académico

Tahamtan, I. & Bornmann, L. Elementos centrales en el proceso de citación de publicaciones: panorama conceptual de la literatura. J. Informetr. 12, 203–216 (2018).

Artículo Google Académico

Tahamtan, I. & Bornmann, L. ¿Qué miden los recuentos de citas? Una revisión actualizada de estudios sobre citas en documentos científicos publicados entre 2006 y 2018. Scientometrics 121, 1635–1684 (2019).

Artículo Google Académico

Bhattacharya, J. & Packalen, M. Stagnation and Scientific Incentives (Documento de trabajo 26752), https://www.nber.org/papers/w26752 (2020).

Azoulay, P., Graff Zivin, JS & Manso, G. Incentivos y creatividad: evidencia desde las ciencias de la vida académica. RAND J. Economía. 42, 527–554 (2011).

Artículo Google Académico

Baltimore, D. ADN polimerasa dependiente de ARN viral: ADN polimerasa dependiente de ARN en viriones de virus tumorales de ARN. Naturaleza 226, 1209-1211 (1970).

Artículo ADS CAS Google Académico

Page, L. Método para la clasificación de nodos en una base de datos vinculada. Patente estadounidense 6.285.999 (2001).

Axel, R., Wigler, MH & Silverstein, SJ Procesos para insertar ADN en células eucarióticas y para producir materiales proteicos. Patente estadounidense 4.634.665 (1983).

Hawkbaker, MS Variedad de soja SE90346. Patente estadounidense 6.958.436 (2005).

Katsuki, T. & Sharpless, KB El primer método práctico para la epoxidación asimétrica. Mermelada. química Soc. 102, 5974–5976 (1980).

Riess, AG, et al. Evidencia observacional de supernovas para un universo en aceleración y una constante cosmológica. Astron. J. 116, 1009 (1998).

Dirac, PAM La teoría cuántica del electrón. proc. R. Soc. largo Una Matemática. física ciencia 117, 610–624 (1928).

ANUNCIOS MATEMÁTICOS Google Académico

Sanger, F., Nicklen, S. & Coulson, AR Secuenciación de ADN con inhibidores de terminación de cadena. proc. Academia Nacional. ciencia USA 74, 5463–5467 (1977).

Artículo ADS CAS Google Académico

Bednorz, JG & Müller, KA Posible superconductividad Tc alta en el sistema Ba-La-Cu-O. Z. Phys. B condensa. Materia 64, 189–193 (1986).

Wuchty, S., Jones, BF & Uzzi, B. El creciente dominio de los equipos en la producción de conocimiento. Ciencia 316, 1036–1039 (2007).

Artículo ADS CAS Google Académico

Guimera, R., Uzzi, B., Spiro, J. & Amaral, LAN Los mecanismos de ensamblaje del equipo determinan la estructura de la red de colaboración y el desempeño del equipo. Ciencia 308, 697–702 (2005).

Artículo ADS CAS Google Académico

Jones, BF, Wuchty, S. & Uzzi, B. Equipos de investigación de varias universidades: impacto cambiante, geografía y estratificación en la ciencia. Ciencia 322, 1259–1262 (2008).

Artículo ADS CAS Google Académico

Grömping, U. Estimadores de importancia relativa en regresión lineal basados ​​en descomposición de varianza. Soy. Estadística 61, 139–147 (2007).

Artículo MathSciNet Google Académico

Mukherjee, S., Uzzi, B., Jones, B. & Stringer, M. Un nuevo método para identificar recombinaciones del conocimiento existente asociado con la innovación de alto impacto. J.Prod. innovador Administrar. 33, 224–236 (2016).

Artículo Google Académico

Christianson, NH, Sizemore Blevins, A. & Bassett, DS Arquitectura y evolución de redes semánticas en textos de matemáticas. proc. R. Soc. A 476, 20190741 (2020).

Artículo ADS MathSciNet MATH Google Scholar

Newman, MEJ La estructura de las redes de colaboración científica. proc. Academia Nacional. ciencia EE. UU. 98, 404–409 (2001).

Artículo ADS MathSciNet CAS MATH Google Scholar

Newman, MEJ Redes de colaboración científica. I. Construcción de redes y resultados fundamentales. física Rev. E 64, 016131 (2001).

Artículo ADS CAS Google Académico

Uzzi, B. & Spiro, J. Colaboración y creatividad: el problema del mundo pequeño. Soy. J. Sociol. 111, 447–504 (2005).

Artículo Google Académico

Funk, RJ Aprovechando al máximo el lugar donde se encuentra: geografía, redes e innovación en las organizaciones. Academia Administrar. J. 57, 193–222 (2014).

Artículo Google Académico

Barabási, A.-L. Ciencia de redes (Cambridge Univ. Press, 2016).

Blau, DM & Weinberg, BA Por qué la fuerza laboral de ciencia e ingeniería de EE. UU. está envejeciendo rápidamente. proc. Academia Nacional. ciencia EE. UU. 114, 3879–3884 (2017).

Artículo ADS CAS Google Académico

Cui, H., Wu, L. & Evans, JA Científicos envejecidos y avance lento. Preimpresión en https://doi.org/10.48550/arXiv.2202.04044 (2022).

Azoulay, P., Fons-Rosen, C. & Graff Zivin, JS ¿La ciencia avanza un funeral a la vez? Soy. economía Rev. 109, 2889–2920 (2019).

Artículo Google Académico

Descargar referencias

Este estudio fue apoyado por la Fundación Nacional de Ciencias (subvención Nos. 1829168, 1932596 y 1829302).

Carlson School of Management, Universidad de Minnesota, Minneapolis, MN, EE. UU.

Michael Park y Russell J.Funk

Facultad de Sociología, Universidad de Arizona, Tucson, AZ, EE. UU.

erin leahey

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

RJF y EL colaboraron en la concepción y el diseño del estudio. RJF y MP colaboraron en la adquisición, análisis e interpretación de los datos. RJF creó el software utilizado en el estudio. RJF, EL y MP en colaboración redactado y revisado el manuscrito.

Correspondencia a Russell J. Funk.

Los autores declaran no tener conflictos de intereses.

Nature agradece a Diana Hicks y a los otros revisores anónimos por su contribución a la revisión por pares de este trabajo. Los informes de los revisores están disponibles.

Nota del editor Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Esta cifra ofrece una visión general de la distribución de CD5 para artículos (n = 24 659 076) y patentes (n = 3 912 353). Los paneles ayc muestran recuentos de documentos y patentes en intervalos discretos de CD5. Los paneles b y d muestran la distribución de CD5 a lo largo del tiempo, dentro de intervalos de 10 (documentos) y 5 (patentes) años, utilizando gráficas de valores de letras. Estos diagramas son similares a los diagramas de caja, pero generalmente brindan resúmenes más confiables para grandes conjuntos de datos. Se dibujan identificando la mediana de la distribución subyacente y luego dibujando recursivamente cuadros hacia afuera desde allí en cualquier dirección que abarquen la mitad de los datos restantes.

Datos fuente

Esta figura evalúa la sensibilidad de nuestros resultados al uso de diferentes ventanas de citas hacia adelante al calcular el índice CD para artículos (n = 24,659,076) y patentes (n = 3,912,353). En el texto principal, el índice se calcula con base en las citas hechas a artículos y patentes y sus referencias anteriores a partir de los 5 años posteriores al año de publicación. a y c trazan el índice de CD utilizando una ventana de avance de 10 años más larga, para documentos y patentes, respectivamente. b y d trazan el índice CD usando todas las citas hacia adelante realizadas a artículos de muestra y patentes a partir del año 2017. Las bandas sombreadas corresponden a intervalos de confianza del 95 %. En general, los resultados reflejan los informados en el texto principal, aunque la disminución es un poco más pronunciada cuando se utilizan ventanas de citas más largas, lo que sugiere que nuestros resultados primarios pueden representar una estimación más conservadora.

Datos fuente

Esta figura muestra los cambios en la proporción de palabras únicas con respecto al total (también conocida como proporción de token de tipo) a lo largo del tiempo según los datos de los resúmenes de los artículos (a, n = 76 observaciones del área de investigación de WoS × año) y las patentes (b, n = 229 categoría de tecnología NBER × observaciones anuales). Para artículos, las líneas corresponden a las áreas de investigación de WoS; para patentes, las líneas corresponden a las categorías de tecnología NBER. Para los resúmenes de artículos, las líneas comienzan en 1992 porque WoS no registra de manera confiable los resúmenes de artículos publicados antes de principios de la década de 1990. La relación entre palabras únicas y totales se calcula por separado por campo (es decir, la singularidad de las palabras y el recuento total de palabras se determinan dentro de las áreas de investigación de WoS y las categorías de tecnología NBER). Si la disrupción está disminuyendo, plausiblemente podemos esperar ver una disminución en la diversidad de palabras utilizadas por científicos e inventores, ya que será menos probable que los descubrimientos e invenciones creen desviaciones del status quo y, por lo tanto, será menos probable que necesiten introducir nueva terminología. Tanto para artículos como para patentes, observamos una diversidad decreciente en el uso de palabras a lo largo del tiempo, lo cual es consistente con esta expectativa y corrobora nuestros hallazgos utilizando el índice CD.

Datos fuente

Esta figura muestra patrones cambiantes en la novedad/convencionalidad combinatoria de artículos (a, n = 24 659 076) y patentes (b, n = 3 912 353), utilizando una medida previamente propuesta de "combinaciones atípicas"14. La medida cuantifica el grado en que se esperaría por casualidad el trabajo anterior citado por un artículo o una patente. Para artículos, seguimos trabajos previos14 y consideramos combinaciones de revistas citadas. Si un artículo hizo tres citas de trabajos anteriores y ese trabajo se publicó en tres revistas diferentes (Nature, Cell y Science), entonces hay tres combinaciones: Nature × Cell, Nature × Science y Science × Cell. Para determinar el grado en que cada combinación se esperaría por casualidad, la frecuencia de los emparejamientos observados se compara con los de 10 copias "reconectadas" de la red de citas general, utilizando una puntuación z. Para las patentes, no existe un análogo natural a las revistas y, por lo tanto, consideramos pares de códigos del sistema primario de clasificación de patentes de los Estados Unidos (USPC). Presentamos los resultados de este análisis siguiendo el enfoque de trabajos previos14, que grafica la función de distribución acumulada de la medida. En general, hay un cambio hacia la derecha en las distribuciones acumulativas a lo largo del tiempo, lo que sugiere que tanto para los artículos como para las patentes, las combinaciones son más convencionales de lo que cabría esperar por casualidad, de acuerdo con lo que anticiparíamos en función de nuestros resultados utilizando el índice CD. Para las patentes, también hay un cambio más pequeño en la dirección opuesta en el lado izquierdo de la distribución, lo que sugiere que las patentes nuevas en las últimas décadas son algo más nuevas que las patentes nuevas en décadas anteriores. En general, sin embargo, la mayor parte de la distribución se está moviendo hacia la derecha, lo que indica una mayor convencionalidad.

Esta figura muestra la contribución relativa de los efectos fijos de campo, año y autor al R2 ajustado en modelos de regresión que predicen CD5. La barra superior muestra los resultados de los artículos (n = 80 607 091 artículos × observaciones del autor); la barra inferior muestra los resultados de las patentes (n = 8,319,826 patentes × observaciones del inventor). Los resultados sugieren que tanto para artículos como para patentes, las características estables de los autores contribuyen significativamente a los patrones de perturbación. Además, relativamente poca de la variación se explica por factores específicos del campo.

Datos fuente

Esta figura muestra los cambios en CD5 a lo largo del tiempo en cuatro fuentes de datos adicionales (las líneas WoS [n = 24 659 076] y Patents View [n = 3 912 353] se incluyen como referencia): JSTOR (n = 1 703 353), el corpus de la American Physical Society (n = 478 373), Microsoft Academic Graph (n = 1 000 000) y PubMed (n = 16 774 282). Los colores indican las seis fuentes de datos diferentes. Las bandas sombreadas corresponden a intervalos de confianza del 95%. La figura indica que es poco probable que la disminución de la disrupción se deba a nuestra elección de muestra de artículos de WoS y patentes de Patents View.

Datos fuente

Esta figura muestra la disminución en la interrupción de documentos (a, n = 100 000) y patentes (b, n = 100 000) con base en dos medidas alternativas de interrupción. Las líneas azules calculan la disrupción usando una medida propuesta en Bornmann et al.13, \({{DI}}_{l}^{{nok}}\) donde l = 5, lo que hace que la medida sea más resistente a cambios marginales en el número de artículos o patentes que solo citan las referencias del trabajo focal. Las líneas naranjas calculan la interrupción usando una medida propuesta en Leydesdorff et al.15, DI*, que hace que la medida sea menos sensible a pequeños cambios en los patrones de citas hacia adelante de artículos o patentes que no hacen citas hacia atrás. Las bandas sombreadas corresponden a intervalos de confianza del 95%. Con ambas medidas alternativas, observamos disminuciones en la disrupción de documentos y patentes, lo que sugiere que la disminución no es un artefacto de nuestra operacionalización de la disrupción.

Datos fuente

Esta figura evalúa si las disminuciones en la perturbación pueden atribuirse a cambios en las prácticas de publicación, citación y autoría de artículos (n = 24 659 076) y patentes (n = 3 912 353). Los paneles ayd se ajustan a estos cambios utilizando un enfoque de normalización. Presentamos dos versiones alternativas del índice de CD, las cuales explican la tendencia de los artículos y las patentes a citar más trabajos anteriores con el tiempo. Las líneas azules indican la normalización a nivel del documento (que representa el número de citas realizadas por el documento/patente focal). Las líneas naranjas indican normalización a nivel de campo y año (considerando el número medio de citas hechas por artículos/patentes en el campo y año focal). Los paneles b (artículos) y e (patentes) se ajustan a los cambios en las prácticas de publicación, citación y autoría utilizando un enfoque de regresión. Los paneles muestran valores predichos de CD5 basados ​​en regresiones informadas en los modelos 4 (artículos) y 8 (patentes) de la Tabla complementaria 1, que se ajustan por campo × año: número de nuevos artículos/patentes, número medio de artículos/patentes citados, promedio número de autores/inventores por artículo/patente—y artículo/nivel de patente—Número de artículos/patentes citados, Número de referencias no vinculadas—características. Las predicciones se realizan por separado para cada indicador de año incluido en los modelos; luego conectamos estas predicciones separadas con líneas para ayudar a la interpretación. Finalmente, los Paneles c (artículos) yf (patentes) se ajustan a los cambios en las prácticas de publicación, citación y autoría utilizando un enfoque de simulación. Los paneles trazan puntuaciones z que comparan los valores de CD5 obtenidos de las redes de citas observadas con los obtenidos de copias reconfiguradas aleatoriamente de las redes observadas. En los seis paneles, las bandas sombreadas corresponden a intervalos de confianza del 95 %.

Datos fuente

Esta figura muestra el número de artículos (n = 24 659 076) publicados (a) y patentes (n = 3 912 353) concedidas (b) a lo largo del tiempo. Para artículos, las líneas corresponden a las áreas de investigación de WoS; para patentes, las líneas corresponden a las categorías de tecnología NBER.

Datos fuente

Secciones complementarias 1 a 3, tablas 1 a 3 y referencias.

Springer Nature o su licenciante (p. ej., una sociedad u otro socio) posee los derechos exclusivos de este artículo en virtud de un acuerdo de publicación con los autores u otros titulares de derechos; el autoarchivo del autor de la versión manuscrita aceptada de este artículo se rige únicamente por los términos de dicho acuerdo de publicación y la ley aplicable.

Reimpresiones y permisos

Park, M., Leahey, E. & Funk, RJ Los papeles y las patentes se están volviendo menos perjudiciales con el tiempo. Naturaleza 613, 138–144 (2023). https://doi.org/10.1038/s41586-022-05543-x

Descargar cita

Recibido: 14 febrero 2022

Aceptado: 08 noviembre 2022

Publicado: 04 enero 2023

Fecha de emisión: 05 de enero de 2023

DOI: https://doi.org/10.1038/s41586-022-05543-x

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt

Revista de Quimioinformática (2023)

Comportamiento humano de la naturaleza (2023)

Naturaleza Ingeniería Biomédica (2023)

Comunicaciones de la naturaleza (2023)

Naturaleza (2023)

Al enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.