메타데이터 Metadata

Cloud Lexicon (사전)

메타데이터 Metadata

Metadata


데이터에 관한 구조화된 데이터로, 다른 데이터를 설명해 주는 데이터.


특정 정보 자산의 여러 측면을 기술하여 정보의 수명 주기 전반에 걸쳐 그 유용성을 개선하기 위한 정보


속성정보라고도 한다. 대량의 정보 가운데에서 찾고 있는 정보를 효율적으로 찾아내서 이용하기 위해 일정한 규칙에 따라 콘텐츠에 대하여 부여되는 데이터이다. 여기에는 콘텐츠의 위치와 내용, 작성자에 관한 정보, 권리 조건, 이용 조건, 이용 내력 등이 기록되어 있다. 컴퓨터에서는 보통 메타데이터를 데이터를 표현하기 위한 목적과 데이터를 빨리 찾기 위한 목적으로 사용하고 있다. 정보를 자산으로 만들어 준다.  


예를 들어, 데이터에 대한 정보(메타데이터)는 파일 생성 날짜, 시간, 파일 생성의 지리적 위치, 작성자, 파일 수정 일자, 파일 크기 등이 바로 그것이다. 그외 데이터를 표현하기 위한 목적으로 사용되는 메타데이터의 가장 좋은 예가 HTML 태그이다. 데이터에 관한 구조화라는 것은 HTML 태그 안에 head나 body가 있으며, body 안에는 table이 올 수 있고, table 안에는 tr이, tr 안에는 td가 올 수 있는 것처럼 데이터가 상위에서 하위로 나무(tree) 형태의 구조를 이루고 있다는 의미이다.

 

메타데이터의 또 다른 목적은 데이터를 빨리 찾기 위한 것으로, 컴퓨터에서 정보의 인덱스(Index) 구실을 한다. 우리가 많이 사용하는 데이타베이스도 이러한 메타데이터가 잘 구성되어 있기 때문에 데이터를 빨리 찾을 수 있다.


사용자는 메타데이터를 이용하여 자기가 원하는 특정 데이터(정보)를 검색엔진 등으로 쉽게 찾아낼 수 있다. 영화의 한 신에서 거기 나오는 배우의 데이터를 추출하거나 축구 시합의 비디오에서 골 인 장면만을 뽑아낼 수 있고, 또 이 자료들을 편집할 수 있는 것도 메타데이터의 기능이다.

 

전자의 경우에서나 후자의 경우에 메타데이터는 데이터를 사용하는 사람에게는 보이지 않는다. 그러나 기계(컴퓨터)는 메타데이터의 내용을 이해하고 이를 이용한다. 곧, 웹 자료나 다른 것들에 관해 기계가 이해할 수 있는 정보가 메타데이터인 것이다.



메타(Meta)는 일반적으로 "~에 관한"(about)이라는 의미로 사용된다. 

따라서 메타언어는 다른 데이터를 기술하기 위해 사용되는 언어이며, 

메타데이터는 다른 데이터를 기술하기 위해 사용하는 데이터라고 할 수 있다. 


인쇄 출판물을 포함한 모든 유형의 정보자원을 기술하는 용어이기 때문에 문헌정보학을 전공하는 학생이라면 머리 아프게 외워야 하는 학문.


1990년대 초반까지 이 용어는 과학 및 사회과학, 지형공간의 데이터세트에 관련하여 컴퓨터 파일이 인간에게 도움이 되도록 하기 위해 필요한 정보라는 의미로 사용되었다.


이용자는 메타데이터로 자기가 원하는 특정 데이터를 검색엔진 등으로 쉽게 찾아낼 수 있다. 

이에 대한 예시로, 월드컵을 녹화한 비디오에서 골인 장면만을 뽑아낼 수 있고, 메타데이터는 이 자료를 이용하여 뽑아낼 수 있다.

그러나 메타데이터는 데이터를 사용하는 사람에게는 보이지 않으며, 컴퓨터가 이러한 메타데이터의 내용을 이해하고 이를 이용한다.



메타데이터 종류


1. 기술용 메타데이터

정보자원의 검색을 목적으로 한 메타데이터. 기술용 메타데이터의 목적은 어떤 자원을 어떻게 찾아내는지의 발견(discovery), 어떤 자원을 다른 유사한 자원과 어떻게 구분하는지에 대한 식별, 어떤 자원이 특정 자원을 만족시킨다는 사실을 어떻게 결정하는 지의 목적을 충족시키는 선정 등이 있다. 전통적인 도서관 편목에서의 메타데이터는 기본적으로 기술적인 것들이다.


2. 관리용 메타데이터

자원의 관리를 어떻게든 용이하게 하기 위한 메타데이터. 어떤 객체가 언제 어떻게 작성되었나, 주 내용에 대한 접근을 관리하는 등의 책임은 누가 가지며, 접근이나 이용에 대한 어떤 제약이 적용될 수 있는지를 포함한다. 그러나 일반적으로 기술용과 관리용 사이의 경계는 애매모호하며 그 기준은 메타데이터 이용자의 시각에 따라 결정되는 경우가 많다.


3. 구조용 메타데이터

복합적인 디지털 객체들을 함께 묶어주기 위한 메타데이터. 물리적인 파일과 페이지, 페이지의 장, 장과 전체로서의 책 사이의 관계를 기록하기 위해 필요하다. 구조용 메타데이터는 수치 데이터세트와 통계 데이터세트의 데이터 요소의 순서와 포맷을 문서화하며, 그 목적이 어떤 엔티티의 이용이 가능하도록 하는 것이다.


메타데이터 포맷 종류

현재는 파일이 일종의 "컨테이너"로서 파일 형식에 따른 전용 메타데이터 구조/형식을 갖지만, 과거 메타데이터 개념이 없었을 당시 만들어지고 널리 사용된 파일형식은 시간이 지나 필요에 의해 별도 이름/형식의 메타데이터가 붙게 되었다.


이미지

EXIF: JPG의 메타데이터, 디지털 카메라 회사에서 관여한 표준이다.

XMP: PNG의 메타데이터, Adobe에서 제정한 ISO 표준이다.


음악

ID3: MP3의 메타데이터. ID3v1(파일 끝에 기록), ID3v2(파일 시작부에 기록) 버전이 있으며, ID3v2.4(UTF-8), v2.3(ISO-8859-1, 로마자용), v2.3(UTF-16, 한국어 포함 국제용, 윈도우7에서 지원) 버전이 있다. AAC, DSF같이 메타데이터를 넣을 것을 계획하지 않았던 음악 파일들도 이 방식의 메타데이터를 끌어다 쓰기도 한다. 가끔 버전별로 중복기록 되기도 한다.

APE: MP3의 메타데이터. APEv1, APEv2 버전이 있다.

Vorbis comment: FLAC, Ogg, Opus(오디오 코덱) 등의 Xiph.Org를 비롯한 자유 소프트웨어 단체들이 지원하는 메타데이터.

m4a의 경우 mp4 컨테이너 표준을 따른다. ISO나 Quicktime이나 iTunes Metadata로 불리기도 한다.

WMA의 경우 WMV 컨테이너 표준을 따른다.

MKA의 경우 MKV 컨테이너 표준을 따른다. Matroska Tags로 불린다.


자막

smi: 국내 자막

srt: 해외 자막

lrc: 알송에서 지원하는 자막


영상

ISO/IEC 14496-12, ISO/IEC 15444-12: MP4의 컨테이너로서 메타데이터 정보도 함께 정의하고 있다.

MKV의 경우 자체 표준을 따른다. WebM은 MKV에서 발전되었다.

0 Comments