애드센스세로

Google 광고

구글애널리틱스


애드센스가로


시멘틱 웹에 대한 몇가지 오해

최근 인공지능 50주년을 맞아 관련 행사들이 많이 열리고 있습니다. Tim Berners Lee 역시 이에 맞아 Semantic Web 기술에 대한 Keynote를 발표했습니다. 이 키노트의 몇몇 부분이 조금은 오해의 소지가 있도록 해석된 사례들이 있는 것 같아서 올립니다.

1. SW = AI
Semantic Web이 인공지능이 아니고 인공지능이 Semantic Web이 아니라는 것은 인공지능을 배척하는 것이 아니라 Semantic Web의 범위를 나타내려는 의도입니다. Semantic Web은 Project이고 인공지능은 Field라는 말이 이를 잘 나타내주고 있는데, Semantic Web은 Machine Readable(or Understandable)한 언어를 개발하고 이를 표준화하여 Interoperable 하게 만드는데 있지 여기서의 추론 등은 Semantic Web의 범위가 아니라는 것이죠. Semantic Web이 AI로 부터 많은 지식을 가져왔고 Semantic Web이 AI를 위한 좋은 Playground가 된다는 말, 그래서 Interoperable한 AI를 위해서는 Semantic Web을 사용해야 한다는 말이 이를 나타냅니다. 즉 좋은 추론 알고리즘등은 인공지능이라는 Field에서 개발하고 이를 Semantic Web에서 개발한 언어에 사용하라는 것이지요.

2. SW is Description Logic
Semantic Web은 URI를 이용하여 대상을 가르키고 그 설명을 적기위한 언어이지 그 자체로 Description Logic은 아닙니다. 이는 첫번째 말과 괘를 같이하고 있습니다. 즉, SW라는 프로젝트의 범위는 AI 등 다양한 방법으로 사용될 수 있는 Interoperable한 언어를 만드는 것이 목표입니다.

3. SW is just about public data
웹 기술이 꼭 공개 데이터에만 써야한다는 법은 없습니다. 실제로 저희 회사 인트라넷도 웹 기술을 이용하여 사용하고 있기도 하고요. SW 역시 인트라넷에서 사용할 수도 있고 이 경우 Ontology Difference와 같은 문제는 문제가 되지 않기도 합니다.

4. The semantic Web is metadata for classifying documents
Semantic Web은 데이터를 분류하는 것이 아니라 데이터 그 자체입니다. 물론 Semantic Web 자체가 metadata 기술의 일환으로 개발되었지만 문서에는 100의 정보가 있고 Semantic Web에는 그것의 분류에 대한 정보만 존재하는 것은 진정한 Semantic Web이라고 보기 힘들지요. 그렇다고 따로 두 벌의 콘텐트를 만들라는 의미는 아닙니다. GRDDL 같은 기술들을 개발하여 기존의 XHTML 등으로 이루어진 웹과 Semantic 웹이 공존해야 하는 것이지요.

5. The semantic web is about hand-annotated web pages
손으로 온톨로지를 구축하거나 RDF를 써야하는 것은 아닙니다. 당연히 자동화된 시스템, 도구들의 도움을 받을 것이며 실제 사용자는 시멘틱웹 기술에 대해서 전혀 몰라도 사용이 가능할 것입니다.

6. The semantic web is mainly about content extracted from text
시멘틱 웹을 하기 위해서 자연어 처리를 해야한다는 것은 아닙니다. 시멘틱 웹은 현존하는 관계형 DB 등의 도움을 받을 것이며 상호 대화할 수 있는 중간언어 역할을 수행할 것입니다. 기존 XML, XHTML 데이터를 시멘틱 웹에서 재활용 할 수 있도록 하는 GRDDL 등의 기술은 정확히 이러한 목표를 위해 사용됩니다.

7. The Semantic Web is about making one big ontology
당연히 Semantic Web도 웹과 마찬가지로 분산 환경을 염두에 두고 있으며, 커다란 하나의 온톨로지가 아니라 소규모의 많은 온톨리지가 연결된 형태를 지향합니다.

8. The semantic web ontologies must all be consistent
동시에 같이 쓰이는 온톨로지만 일관적이면 됩니다. 또한 최근의 많은 기술들은 Ontology Difference를 해결하고 맞추는 기술을 제공합니다.

가능한 원문의 의도 그대로 나타내려고 노력했지만 틀린 부분이 있을 수도 있습니다. 댓글로 알려주시면 수정하겠습니다.

http://www.w3.org/2006/Talks/0718-aaai-tbl/Overview.html

덧글

  • 거부기아찌 2006/07/24 08:13 # 삭제 답글

    "시맨틱 웹은 AI가 아니다"는 선언적인 의미를 너무 약하게 해셕하신 것 같네요. 이 문제는 시맨틱 웹의 범위가 자주 AI와 혼동되고, 또 이런 점으로 공격을 받기 때문에 나온 "강한 의미의 반대 표현"입니다. 더불어 or로 표현된 Machine Understandable 이란 표현 자체가 AI와 SW을 구분하는 용어중의 하나로 이야기되기도 하죠.

    W3C에서 Semantic Web에서는 AI와의 범위를 규정한 이후부터는 Machine Understandable이란 표현을 사용하지 않습니다. 아직도 AI와의 연관성을 생각하는 사람들이 종종 사용하고 있는 표현일 뿐이죠.

    이렇게 강하게 반대표현을 함에도 불구하고 아직 국내에서는 공공연하게 SW은 AI라고 말하고 다니시는 분들도 많죠.
  • 달삼 2006/07/24 10:39 # 답글

    거부기아찌/ 그렇다면 "SW owes a debt: used much from AI"라던가 "SW should be a great playground for AI"라는 말을 하지 않았을 것 같은데요. SW는 표준 언어 개발, AI는 SW에서 개발된 언어 활용 이라고 말하고 있는 것이 맞지 않나요?
  • 거부기아찌 2006/07/24 11:44 # 삭제 답글

    그 발표자료는 AAAI에서 발표한 자료니까, AI와의 가능한 연관성에 대해 표현을 한 것이죠. 시맨틱 웹의 "시맨틱"은 AI로부터 차용한 것이니까 관련이 전혀 없다는 것이 말이 않되죠. 기본적인 연관관계는 있고, 그러니 서로 잘 협력하면 좋다. 그러나 AI와 SW는 다른 것이므로 고유한 관점의 길을 가야한다는 이야기를 하는 것이죠.
댓글 입력 영역