Skip to content

Knowledge sharing international case in the field of software development (Main Path Analysis)

October 21, 2013

Main Path Analysis and its areas of application

Main Path Analysis (Hummon & Doreian 1989) is a network analysis technique for the scientometric study of scientific citations over a period of time. Its major application is the identification of key publications in the development of a scientific field considering the inherent temporal structure of development. Temporality is explicitly accounted for through the very definition of a directed acyclic graph (DAG) where nodes are single publications and directed edges represent citations between publications. The direction of an edge corresponds to the flow of knowledge from the cited publication to the citing publication. Therefore, these links incorporate both the dimension of content relations and the temporal order of the contributions.

In the citation network of scientific publications within one field, often one important publication is chosen as a starting point of the development of the field. This publication represents the first source. Sink nodes then represent either unimportant or very new publications that have not been cited yet. In this sense there is an implicit notion of time where sources are the oldest (or not cited) publications and sinks are the newest ones.

The main path can be described as the most used path in a citation network taking all possible paths from the source nodes to the sink nodes.

Case 1: Computer Supported Collaborative Learning (CSCL)

For the knowledge sharing cases in the field of computer science we decided to analyze the communities of Computer Supported Collaborative Learning (CSCL) and the community of Artificial Intelligence in Education (AIED). Figure 27 shows the Main Path of one part of the CSCL community from 1990 to 2012. The data has been retrieved from the Web of Knowledge and covers mainly the publications related to Psychology and Pedagogics.

Figure 27. Main Path of the CSCL community 1990 to 2012

Figure 27. Main Path of the CSCL community 1990 to 2012

We can clearly identify that the path starts with a survey book chapter by Clark and Brennan published in 1991 about the grounding process in communication in an edited book about socially shared cognition. This idea has been taken by Baker and Lund in a frequently cited paper on reflective interaction in the collaborative learning context. This also shows a meaningful development in the field where dialogues like chats and especially the reflective process of explaining in such contexts have been empirically identified as important for the learning processes. As we can see at the end of the main path in the upper left the paper by Dan Suthers and his colleagues defining a framework for conceptualizing, representing, and analyzing distributed interaction leads the main path into a small star. This end of the path indeed shows a side by side development of dialogical interactions and analytics around these interaction and communication processes within the field of Computer Supported Learning.

Case 2: Artificial Intelligence in Education (AIED)

Since the data on the CSCL is limited to parts of the community the contrasting case of Artificial Intelligence in Education (AIED) covers the citation data in the Arnetminer database that uses the DBLP database and also links the data to the ACM database. In this case the selection of the publications based on the venues, such as the AIED conference in our case, is possible due to the structure of DBLP and the references of these selected publications which are used to generate the citation networks for the Main Path Analysis that are given by the ACM data. The network is based on all papers published in the proceedings of AIED. The AIED conference takes place every second year. Our data starts with a seed in the 2009 AIED conference which took place in Brighton. From that point forth we moved back to references to 2000. The analysis uses a simple workflow as shown in Figure 28.

Figure 28. Main Path Analysis workflow for the AIED analysis

Figure 28. Main Path Analysis workflow for the AIED analysis

Since our implementation of the SPC allows more than one path our case interestingly shows two main components in the path. Figure 29 shows the bigger main component. This component is corresponding to the trend which we already identified for the CSCL community and refers to the support and analysis of interaction and communication within computer supported learning scenarios. The second smaller component in Figure 30 shows the second major area in the field of AIED that contains papers about intelligent tutoring systems that can be seen as a more traditional research domain within this area.

In general the cases show that Main Path Analysis can definitely show trends at a level that is abstract enough to contrast and compare different communities. Our cases for CSCL and AIED can demonstrate clearly that there is one common trend around the support and analysis of interaction and communication in computer supported learning contexts for both communities even though the papers and their authors are different. Main Path Analysis and especially our implementation which allows more than one path can also show special aspects of individual scientific communities like the example of the existing path for Intelligent Tutoring Systems in the AIED community highlights for our cases. The implicit temporal structure also allows the very clear observation of knowledge sharing trajectories for scientific communities and their citation trails.

Figure 29. Interaction and communication support and analysis component

Figure 29. Interaction and communication support and analysis component

Figure 30. Intelligent Tutoring systems main path component

Figure 30. Intelligent Tutoring systems main path component

Referencias

Hummon, N. P. and Doreian, P. 1989. Connectivity in a Citation Network: The Development of DNA Theory. Social Networks, 11, 39-63.

Sam Zeini and Nora Pfuetzenreuter
Universität Duisburg-Essen (UDE)

diseminación

Análisis de la Ruta Principal y áreas de aplicación

El análisis de Ruta Principal (Hummon & Doreian 1989) es una técnica de análisis de redes para el estudio cienciométrico de citas científicas en un periodo de tiempo determinado. Su principal aplicación es la de identificar publicaciones clave en el desarrollo de un ámbito científico teniendo en cuenta la propia estructura temporal de desarrollo. Dicha temporalidad se representa explícitamente mediante la misma definición que se aplica a un grafo acíclico dirigido (DAG) en el que sus nodos corresponden a las publicaciones únicas y las aristas representan las citas entre  publicaciones. La dirección de una arista corresponde al flujo de conocimiento desde la publicación citada a la invocación de la misma. Por tanto, estos vínculos aúnan tanto la relación de contenidos como el orden temporal de sus contribuciones.

Con frecuencia se elige una publicación importante de la red de citaciones de publicaciones científicas de un campo concreto como punto de partida para el desarrollo de dicho campo. Esta publicación se convierte así en la primera fuente. Los nodos sumidero representan, pues, a aquellas publicaciones poco significativas o nuevas que aún no han sido citadas. En este sentido existe una noción implícita de tiempo en el que las fuentes representan a las publicaciones más antiguas (o no citadas) y los nodos sumidero se corresponden con las más recientes o nuevas.

La ruta principal puede describirse como la más usada en la red de citas tomando todas las rutas posibles desde los nodos fuente hasta los nodos sumidero.

Caso 1: Aprendizaje en Colaboración Asistido por Ordenador (CSCL)

Para los casos de intercambio de información en el campo informático decidimos analizar las comunidades de Aprendizaje en Colaboración Asistido por Ordenador (CSCL) y la comunidad de Inteligencia Artificial en Educación (AIED). La Ilustración 27 muestra la ruta principal de una parte de la comunidad CSCL desde 1990 hasta 2012. Los datos se han extraído de la Web del Conocimiento y abarcan principalmente las publicaciones relativas a Psicología y Pedagogía.

Ilustración 27. Ruta Principal de la comunidad CSCL de 1990 a 2012.

Ilustración 27. Ruta Principal de la comunidad CSCL de 1990 a 2012.

Se puede identificar claramente que la ruta comienza con el sondeo de un capítulo del libro publicado por Clark y Brennan en 1991 acerca del proceso de la comunicación, en un libro editado sobre el conocimiento socialmente compartido. Esta idea se basa en un artículo de Baker y Lund citado en reiteradas ocasiones acerca de la interacción reflexiva en el contexto del aprendizaje colaborativo, mostrándose, además, un desarrollo significativo en un campo donde diálogos como los chats y, en concreto, el proceso reflexivo de la explicación en dichos contextos han sido empíricamente identificados como importantes en los procesos de aprendizaje. Como se puede ver al final de la ruta principal en la parte superior izquierda, el artículo de Dan Suthers y sus colegas que define un marco para conceptualizar, representar y analizar la interacción distribuida, conduce la ruta principal hacia la estrella pequeña. Este final de ruta, de hecho, muestra un desarrollo en paralelo de las interacciones de diálogo y análisis en torno a estos procesos de interacción y comunicación en el campo del Aprendizaje Asistido por Ordenador.

Caso 2: Inteligencia Artificial en la Educación (AIED)

Puesto que los datos sobre el CSCL se limitan a parte de la comunidad, el caso contrastado de la Inteligencia Artificial en la Educación (AIED) puede cubrir los datos de citación de la base de datos Arnetminer1, que utiliza la base de datos DBLP2 además de vincular los datos a la base ACM3. En este caso, la selección de las publicaciones basada en los eventos, como por ejemplo y en nuestro caso la conferencia AIED, es posible dada la estructura del DBLP y las referencias a las publicaciones seleccionadas usadas para generar las redes de citación para el Análisis de Ruta Principal proporcionadas por la base de datos ACM. La red se basa en todos los artículos publicados en las acciones del AIED. Dicha conferencia tiene lugar cada dos años. Nuestros datos parten de los resultados de la conferencia AIED del año 2009, acontecida en Brighton. De ahí en adelante retrocedemos en busca de referencias al año 2000. El análisis utiliza un sencillo flujo de trabajo como se muestra en la Ilustración 28.

Ilustración 28. Flujo de trabajo del análisis de la ruta principal para el análisis del AIED

Ilustración 28. Flujo de trabajo del análisis de la ruta principal para el análisis del AIED

Puesto que nuestra aplicación del SPC permite más de una ruta, nuestro caso muestra curiosamente dos componentes principales en la ruta. La Ilustración 29 muestra el mayor de dichos componentes, que se corresponde con la tendencia ya identificada para la comunidad del CSCL y referida al soporte y análisis de la interacción y comunicación en escenarios de aprendizaje asistido por ordenador. El segundo y más pequeño componente de la Ilustración 30 muestra el segundo mayor tema en el campo del AIED y que incluye artículos sobre sistemas tutoriales inteligentes que pueden considerarse más del ámbito tradicional de la investigación.

En general, los casos muestran que el Análisis de Ruta Principal puede ciertamente mostrar las tendencias a un nivel lo suficientemente abstracto como para poder contrastar y comparar diferentes comunidades. Nuestros casos para CSCL y AIED demuestran claramente la existencia de una tendencia común en torno al soporte y análisis de interacción y comunicación en contextos de aprendizaje asistido por ordenador para ambas comunidades, a pesar de que tanto los artículos como los autores de los mismos son diferentes. El Análisis de Ruta Principal  y en concreto nuestra aplicación que permite más de una ruta, puede mostrar además aspectos especiales de las comunidades científicas individuales como el ejemplo de la ruta existente para los Sistemas Tutoriales Inteligentes en la comunidad AIED destacada en nuestros casos. La estructura temporal implícita también permite una observación muy clara de las trayectorias de intercambio de información para las comunidades científicas y su consecuente estela de citas.

Ilustración 29. Componentes de soporte y análisis de la interacción y comunicación

Ilustración 29. Componentes de soporte y análisis de la interacción y comunicación

Ilustración 30. Componente de la ruta principal en Sistemas Tutoriales Inteligentes

Ilustración 30. Componente de la ruta principal en Sistemas Tutoriales Inteligentes

Referencias

Hummon, N. P. and Doreian, P. 1989. Connectivity in a Citation Network: The Development of DNA Theory. Social Networks, 11, 39-63.

Sam Zeini and Nora Pfuetzenreuter
Universität Duisburg-Essen (UDE)
No comments yet

Leave a comment