transparente

Bibliometría

Cómo calcular el índice g

Álvaro Roldán López
26 November 2009

En su día (a lo tonto, a lo tonto, hace ya más de 4 años) explicaba en BiDo cómo calcular el índice h. Hace poco (a lo tonto, a lo tonto, hace ya mes y medio) una lectora, Fátima, me dejaba en los comentarios de Cambio de modelo productivo la petición de que explicara cómo se calcula el índice g (Egghe, 2006) y las diferencias que existen frente al índice h, así que vamos a ello.

Según su creador, Leo Egghe, el g-index mantiene todas las propiedades positivas del h-index y lo mejora, al contemplar todas las citas de los artículos más citados, propiedad que permite distinguir entre científicos con índices h muy similares, ya que el número g es mayor y más variable que el h. Eso según su creador. Yo le encuentro un pero que tira por tierra todas las ventajas que se quieran presentar, y es su dificultad de cálculo frente al índice h. A continuación voy a calcular el índice h de Jose Luis Lanciego. Busco por autor Lanciego JL (sin meterme en más precisiones, aunque soy consciente de que es una búsqueda demasiado tosca). Son las 21:49. Ordeno por Times Cited. Paso a la siguiente página porque los resultados siguen estando dentro del índice h. En la segunda página compruebo que el artículo número 15 tiene 15 citas. Su número h es 15. Son las 21:51. Continúo a partir de aquí para calcular el índice g. Cuando acabe os cuento qué hora es y luego paso a explicaros paso a paso su cálculo. Son las 22:00 y el índice g es de 23 (si no me he equivocado con las prisas). En su cálculo empleamos cuatro veces más tiempo y, además de la base de datos que usemos (en mi caso Wob of Knowledge) necesitamos una hoja de cálculo para agilizar las cuentas.

Para calcular el índice g necesitamos ordenar por número de citas de manera descendiente los artículos. Ordenados así, extraemos la siguiente información:

Posición del artículo (r), número de citas (TC), posición al cuadrado (r2) y número de citas acumuladas (ΣTC)

r TC r2 ΣTC
1 118 1 118
2 111 4 229
3 49 9 278
4 25 16 303
5 24 25 327
6 23 36 350
7 22 49 372
8 21 64 393
9 20 81 413
10 19 100 432
11 18 121 450
12 18 144 468
13 16 169 484
14 15 196 499
15 15 225 514
16 14 256 528
17 7 289 535
18 7 324 542
19 6 361 548
20 5 400 553
21 5 441 558
22 5 484 563
23 5 529 568
24 4 576 572

Si el número h es la última posición en la que el número de citas es mayor o igual a la posición (en la posición 15 el número de citas es 15 pero en la posición 16 el número de citas ya es inferior a 16, concretamente 14 en este caso), el número g es la última posición en la que el número de citas acumuladas es igual o mayor que la posición al cuadrado (en la posición 23 nos encontramos con 568 citas acumuladas, una cifra mayor que la posición al cuadrado, 529; sin embargo en la posición 24 la posición al cuadrado, 576 supera el número de citas acumuladas, 572).

Ahora que lo he calculado, me doy cuenta de que no es tan complejo. Una vez que tienes preparada una hoja de excel con las posiciones y las posiciones al cuadrado, que son cifras que te valen para todos los investigadores para los que vayas a hacer el cálculo sólo tienes que ir introduciendo las citas en otra columna, porque el sumatorio de las citas lo puedes tener también calculado. Aun así es más complicado que el índice h. ¿Y merece la pena el trabajo para contemplar todas las citas de los trabajos más citados? En algunos casos puede que esté bien saberlo. En este ejemplo no parece aportar nada, pero si uno se dedica a calcular el índice de varios investigadores con índice h similar, observa notables diferencias y es cierto que arroja luz. Se puede observar con los cálculos que hace Egghe en el artículo (ver Appendix) con el que abre su fulgurante saga del índice g y sus comparaciones con el índice h.

Publique un comentario