웹표준, 디자인과 정보/데이터의 분리 필요한가?

전의 게시물에서 웹표준에 부정적인 글을 올린 바 있습니다(웹표준과 CSS, XHTML, HTML, CSS 그리고 테이블, 표준은 어디에나 존재한다. but…). 그 당시 웹표준(CSS+XHTML)에 대해서 회의적인 글이었는데, 일모리님의 좋은 포스팅으로 인해서 웹표준을 따르는 형식을 간단하게나마 구현하는 것이 좋지 않을까 라는 생각도 들었습니다.

그런데, 지금 나오는 웹표준에 대한 이야기는 조금 더 포괄적으로 접근하고 있습니다.

AJAX, XML, RDF 즉, 데이터의 표현 형식과 이동 방법까지도 얘기가 나오고 있는데, 이 부분에 대한 색다른 고찰을 해 보려 합니다.

데이터란 무엇인가

웹 초창기에는 데이터는 당연히 텍스트와 표에 한정되었습니다. 그것은 전통적인 태그들을 보면 알 수 있겠죠. 트래픽도 한정되어 있었기 때문에 추가한다면 그림 정도가 됩니다. 하지만, 현재의 데이터는 꼭 그런것은 아닙니다. 정의하자면 “디지털로 전송될 수 있는 모든 것”이라고 볼 수 있습니다. 기술적으로 말하자면, 인코딩/디코딩이 가능한 정보입니다. 이론적으로 그런 정의에 따른다면 지구상에 존재하는 모든 것이 인터넷 상의 데이터로 존재할 수 있습니다.

그럼 정보는 무엇인가?

일반적으로 데이터가 데이터 그 자체(Raw)로 의미를 갖는데 반해 정보는 받는 입장에서 봐야 합니다. 즉, 같은 데이터라도 보는(혹은 듣는) 이의 반응이 틀리다면 그것은 다른 정보를 갖는다고 볼 수 있습니다.

이 같은 것을 쉽게 쓴다면, “데이터는 정보를 싣고” 라는 말이 성립됩니다.

웹표준은 정보를 정확히 전달할 수 있는가?

정보 전달의 목적으로 나온 것이 XML이라는 것인데, 기본적으로 정보의 프리젠테이션 레이어(어떻게 보여지느냐)를 분리해서 정보 그 자체의 처리를 쉽게 하고, 공유까지 가능케 하는데 목적이 있습니다. RSS를 예로 들면 블로그의 RSS를 공개할 경우 다른 메타사이트나 RSS 리더가 쉽게 그 내용을 가져오거나 볼 수 있게 할 수 있습니다.

여기서의 문제는 정보의 의미를 XML이 제대로 전달할 수 있느냐 하는 것입니다.

독방에서만 수십년을 살아온 사람이 아니라면 “분위기”라는 것이 정보 전달에 있어서 매우 중요한 역할을 한다는 사실을 알 수 있을 것입니다. 그리고, “아는 만큼 보인다”라는 말은 지금도 흔히 통용되고 있습니다. 만약 정보(그림, 비디오, 글, 폰트, 음악, 소리, 그 밖에 돌에 쓰여진 그림, 음악과 같이 흘러나오는 시 같은 여러가지 정보의 복합체를 포함)의 제공자가 특별한 분위기를 전하기 위해서 여러가지 형태의 정보를 결합한 새로운 컨텐츠를 제공한다고 할 때, 그것을 웹표준이라는 것이 정확히 전달할 수 있을까요? 플래시로 구현된 복합 저작물이 AJAX로 구현될 수 있을까요?

이러한 복합 저작물을 영어로는 리치미디어라고 불리웁니다. 여기서 리치는 고대역 트래픽을 사용한다는 의미로 통용되는데, 보통은 동영상 플래이어나 플래시 기반의 컨텐츠를 말합니다.

웹표준은 기본적으로 “분리”를 추구합니다. 즉, 컨텐츠를 어떤 테마로 쪼개고 쪼개서 보는 이가 재조립을 해서 볼 수 있게 만들고, 그것을 표준화시켜서 많은 데이터를 다룰 수 있게 만들어 줍니다. 그것은 공학적인 접근에서 본다면 일 자체를 매우 편하게 해주는 의미가 있습니다.

실제로 만약 모든 인터넷상의 데이터들이 XML을 정확히 따른다고 하면 검색엔진의 크롤러(컨텐츠를 가져오는 프로그램)를 제작하는 것이 더욱 용이해 질 것임에 틀림없습니다.

하지만, 표준화의 문제에서 항상 불거져나오는 문제는 표준을 따르지 않는 컨텐츠는 전달할 방법이 없다는 것입니다.

표준을 따를 수 없는 컨텐츠

만약, 어떤 컨텐츠 제작자가 배경음악을 5초 후에 나오게 만들고, 글은 처음 보여지고 10초 후에 하단으로 내려가며, 마우스가 움직일 때마다 글자가 약간씩 움직이고, 글을 다 읽은 사람은 저작자에게 메일을 보낼 수 있는 컨텐츠를 제작하고 싶어 한다고 칩니다.

이 경우 표준이고 뭐고 의미가 없어져 버립니다. 검색엔진은 텍스트 위주로 보여줄 뿐이고, 동영상 검색도 동영상만을 검색하게 됩니다.

데이터 이동에 있어서 표준의 의미

웹표준이라는 것은 원론적으로 말하자면, 만드는 이를 위한 것이 아니라 보는 이를 위하는 것입니다. 또한, 데이터 이동에 있어서의 표준화는 데이터 가공자를 위한 것이라고 볼 수 있습니다.

CSS+XHTML을 적용하는 웹2.0 기업을 유심히 보면 대부분 컨텐츠 제작보다는 남의 컨텐츠를 쓰고 있다는 사실을 알 수 있습니다. 컨텐츠 제작자는 원래가 데이터를 편하게 공유한다는 것 보다는 자신의 의도한 데로 컨텐츠가 보여지기를 원합니다. 심지어, 음악 제작자는 미디어 플래이어의 속도조절 기능도 원치 않는 경우가 있습니다.

이런 것을 생각해 본다면 컨텐츠 제작자에게 컨텐츠를 표준화 시켜서 만들어 달라는 주문을 해야할까요? 이것은 제가 보기엔 본말이 전도됐다고 밖에는 보이질 않습니다.

표준은 간단하고 일반적이어야 한다

년차가 높은 엔지니어들이 느끼는 것으로 표준이라고 하는 것은 단순(Simple)과 일반적(General)이라는 두가지 특징은 필수적입니다. 모듈과 모듈의 결합도 용이하고 업데이트도 비교적 쉽게 할 수 있습니다. 결정적으로 두가지 요건을 충족시키지 못한 기술은 표준이 될 가능성이 매우 적어지게 됩니다.

하지만, 그것은 엔지니어의 이야기고, 컨텐츠 제작자가 꼭 엔지니어일 필요는 없습니다. 같은 이야기로 모든 컨텐츠가 리더로 읽을 필요는 없습니다.

미래의 웹표준이 어떻게 바뀌건 과거의 표준처럼 간단하고 일반적이어야 할 필요가 있습니다. 그리고, 데이터를 만지는 검색엔진과 같은 시스템은 더욱 일반적인 페이지를 다룰 수 있어야 한다고 믿습니다.

그런 의미에서 RSS만을 검색하는 블로그 메타사이트 보다는 전세계 동영상만을 검색해 주는 야후의 동영상 검색(MRSS와 병행해서 사용하지만)이 미래의 주류가 되야 한다는 것에 한표를 던집니다.

에피소드

포탈들이 홈페이지 무료 서비스를 할 당시 개인 웹사이트들은 개성이 있었습니다. 스크롤되는 시도 있었고, 어설프게나마 플래시로 올려놓고, 폰드도 무지막지하지만 재미있게 꾸미던 페이지들이 많았습니다.

이런 재미있는 페이지들이 없어지고, 비슷한 폰트, 비슷한 디자인으로 전환된 데에는 W3C의 표준이 크게 작용했다고 생각합니다. 그것이 트랜드일지도 모르겠지만, 표준화의 미래가 획일적인 문자로 된 컨텐츠가 되는 모습은 보고 싶지 않습니다.

검색엔진이 잡아낼 수 없는 컨텐츠를 사용자가 자신의 웹페이지에 만들어 놓은 링크를 쫓아가서 발견할 때의 즐거움은 없애고 싶지 않은 NET만의 것이며, 기술적인 스펙 보다 인터넷의 가장 기본이 되는 연결고리인 A태그(링크)를 어떻게 활성화시키고, 해석할 수 있는지 보다 놓은 수준의 연구가 있어야 할 것으로 생각합니다.

Leave a Reply

Your email address will not be published. Required fields are marked *