“월드와이드웹(www) 혁명”에서 가장 혁신적인 개념은 ‘하이퍼링크’라고 할 수 있다. 웹사이트 간에 링크를 주고 받으며 형성된 복잡한 그물망을 통해 사람들은 정보의 교환ㆍ공유뿐만 아니라 다양한 차원의 관계를 새롭게 창출하거나 기존의 관계를 확장시킬 수 있었던 것이다. 이와 같은 ‘연결관계’에 대한 분석은 이미 사회학의 사회연결망분석이나 계량서지학(bibliometrics) 분석 등 많은 영역에서 주요한 관심거리였다고 할 수 있다. 특히 계량서지학은 논문 데이터베이스에 고스란히 담겨 있는 연구협력관계, 인용ㆍ피인용 관계 등의 서지 데이터를 대상으로 다양한 방법론을 발전시켜 왔다고 할 수 있다.
월드와이드웹이 커뮤니케이션의 새로운 매개체로 본격적으로 활용되면서 기존에 볼 수 없던 다양한 양태의 활동들(이른바 "e-science")이 등장한 1990년대 중반이후 계량서지학 영역의 학자들은 분석의 대상으로 월드와이드웹을 주목하게 된다. 이후 논문ㆍ특허 데이터 외에 웹상에서 일어난 링크관계의 속성과 분석 및 활용 방법을 모색하는 연구는 급속히 팽창하게 되어 이른바 webometrics 또는 cybermetrics라는 영역이 자리잡게 되었다.
웹사이트 간의 인용관계(이른바 ‘citation’)가 논문의 인용행위와 과연 같은 유형의 동기에서 생성된 것으로 볼 것인지 그렇지 않다면 어떻게 다루어야 하는지, 또는 하이퍼링크 관계를 수집하는 데 따르는 각종 제약과 데이터의 불완전성을 어떻게 처리할 것인지, 웹사이트 간의 인용관계를 분석할 수 있을 수준으로 실제로 웹을 통한 활동이 활발히 일어나는지 따위의 사항들은 webometrics분석에서 늘 따르는 문제이다. 그러나 뒤엉킨 실타래처럼 보이는 웹 공간이 실은 일정한 유형을 갖는 관계들로 형성되어 있으며, 그러한 관계망에서 각 행위자들이 어떠한 전략적 위치와 영향력을 갖고 있는지를 매핑ㆍ분석하여 각 행위자들의 활동을 파악할 수 있게 한 webometrics 연구는 월드와이드웹이 확장될수록 더욱 주목을 끌 수밖에 없을 것이다.
특히 webometrics 분석은 관심을 갖는 사람이라면 비교적 손쉽게 시도해 볼 수 있다는 점에서도 매력적이다. 필요한 링크 데이터 수집ㆍ처리를 도와주는 공개프로그램(LexiURL, SocSciBot 등)이 개발되어 있고, 굳이 이 S/W들이 아니어도 링크 정보를 제공하는 검색엔진에 필요한 명령어를 입력하여 손수 데이터를 끌어모을 수 있기 때문이다. 아래에서는 webometrics의 DIY를 위한 간단한 예로 경제 관련 연구소들이 웹상에서 동시 링크(co-link)패턴으로 매핑하는 사례를 제시한다.
동시 링크 분석이란 계량서지학에서 ‘동시 인용(co-citation)분석의 개념을 웹상에 적용한 것으로, 어떤 특정 웹페이지에서 A사이트와 B사이트를 동시에 링크한다면, A와 B가 의미론적으로 유사성을 갖는 것으로 여기고 분석 대상인 각 사이트 간에 동시 링크되는 패턴을 분석하여 각 사이트 간의 관계 구조를 매핑하는 방법이다.
사례분석을 위해 11개 공공 또는 민간 경제연구소를 선정하고, 각 연구소 웹페이지 간의 동시 인용 빈도를 추출하기 위해서 야후를 이용하여 아래와 같이(SERI와 KDI간의 동시 링크 빈도) 검색어를 입력한다.
(Link:http://www.seri.org -site:seri.org) AND (Link:http://www.kdi.re.kr -site:kdi.re.kr)
동시 링크 빈도를 수집하였으면, 11×11 행의 대칭형 행렬을 구성한 뒤 각 수치를 정규화 (여기서는 Salton 계수 적용)하고, 이어 다차원척도법(MDS, Multidimensional Scaling)을 통해 매핑을 하면 아래와 같은 <그림>을 얻게 된다.
다차원척도 분석에서 축(axis)을 어떻게 해석할 것인지는 언제나 문제이지만, 여기서는 일단 <그림>과 같이 공공성-민간, 일반성-전문성의 두 축으로 구분해 본다. 이렇게 놓고 보면, 한국개발연구원(KDI), 산업연구원(KIET), 대외경제정책연구원(KIEP)이 서로 가깝게 묶이며, LG경제연구원(LGERI), 한국경제연구원(KERI), 현대경제연구원(HRI)가 가깝게 묶이게 된다. 산업정책연구원(IPS), 포스코경영연구소(POSRI), 한국농촌경제연구원(KREI)는 다른 연구소들과 조금 성격이 다름을 알 수 있다. 여기서 주목할 것은 삼성경제연구소(SERI)가 다른 민간 경제연구소들에 비해 좀 더 차별화된 지위를 갖는 것을 확인할 수 있다. 웹사이트 순위에서 압도적인 1위를 차지하고, 수많은 회원들의 참여가 돋보이는 SERI의 위상은 간단한 webometrics 분석으로도 쉽게 확인이 가능한 것이다.
1) webometrics에 관심이 있는 분은 대표적 연구그룹 http://cybermetrics.wlv.ac.uk/index.html 참조
2) Vaughan, L. and You, J. (2006), Comparing Business Competition Positions Based on Web Co-link Data: The Global Market vs. The Chinese market, Scientometrics, 68(3): 611-628 참조
이준영/KISTI 계량정보분석팀
'개발 및 연구 정보' 카테고리의 다른 글
[Android] TextView 자동 스크롤 (0) | 2012.01.17 |
---|---|
[Android] 소프트 키보드가 나타날때 UI 밀기 (0) | 2012.01.17 |
기초적인 수학 기호 (0) | 2008.01.25 |
[VC++]구조체를 qsort 하기 (0) | 2007.11.06 |
컴퓨터 관련 약어집 (0) | 2007.11.06 |