MARC(Machine Readable Cataloging)
http://www.loc.gov/marc
MARC는 전자책 분야의 표준으로서 각국의 주요 도서관을 중심으로 발전해 오고 있다. 1960년대초 미국의 많은 도서관들의 가장 큰 문제점은 목록작업을 수작업으로 하기에는 너무 방대하다는 것이었다. 그래서 많은 도서관들은 의회도서관(LC)에 기계가독형 목록 데이터베이스를 생산하여 줄 것을 요청하게 되었다. 1966년 11월부터 1968년 6월까지의 MARC 파일럿 프로젝트기간을 거치게 되는데 그당시 LC는 영국국가서지국(BNB)과협력하여 MARC2 혹은 지금의 단지 MARC로 더 많이 알려진 새로운 레코드 포맷의 설계에 밀접한 협력이 이루어졌다. 그때당시 이 포맷이 목표로 한것은 서지 데이터의 재조직이 가능한 자기 테이프로써 서지기술을 전달하고자 하는 것이었다. 그리하여 LC는 1969년 3월부터는 MARC2포맷에 따른 MARC 테잎이 생산되어 구독을 원하는 각 도서관에 배포되기 시작하였다.
MARC를 전면적으로 시행하려면 먼저 도서관의 전 장서가 MARC 포맷의 레코드를 필요로 하게 되자 소급자료의 화일변환이 문제가 된다는 것을 알았다. 그래서 1970년 소급변환프로젝트인 RECON(Retrospective Conversion)이 미국에서 시작되기도 했다.
MARC이후에 나타난 목록시스템의 전산화의 특징은 온라인 도서관네트워크 통한 공동편목 및 목록 생산시스템의 전산화이다. OCLC, RLIN, WLN 등이 그 대표적인 예이다.
DC(Dublin Core)
DC는 네트워크 환경에서 상거래를 수반하는 모든 정보 자원을 기술하기 위한 메타데이터이며 1995년 미국 더블린 OCLC/NCSA DC 1차 워크샵에서 처음으로 성격을 규정하였다. 이 것은 MARC의 복잡한 구조에 대한 대안으로 제시되었다. 현재 15개의 메타데이터 구성 요소를 확정하였다. 확장성을 위한 한정어를 포함하며 한정어는 언어, 스킴, 하위요소 세가지로 구성된다.
MARC포맷
MARC포맷은 세가지 기본요소로 이루어진다. 첫째는 레코드의 기본구조로서 다음과 같이 리더 (leader), 레코드디렉토리(record directory), 데이터필드(data fields)로 구성되고 데이터필드 부는 다시 제어필드(control fields)와 가변장필드(variable fields)로 나뉜다.
+------------+---------------------+--------------+------------------------+
| 리 더 | 레코드 디렉토리 | 제어필드 | 가변장필드 |
+------------+---------------------+--------------+------------------------+
+-----+------+-----------+---------+--------------------+------------------+
24자 12자×데이터필드수+1 코드데이터 및 서지데이터
둘째 요소는 레코드내의 데이터를 식별하는 식별기호 내지는 식별방법으로 각각의 서지데이터 를 구별하는 세자리 숫자인 태그(Tags), 각 가변장필드에 대한 부수적인 정보를 제공하는 두자리 코드인 지시기호(indicators)가 사용된다.
셋째 요소는 데이터필드에 수록된 데이터 자체를 말한다.
가. 리더
리더는 24자로 구성되는 고정장필드로 내용은 다음가 같다.
데이터 요소 위치 길이(자수)
-----------------------------------------------------------
레코드 길이 0-4 5
레코드 상태 5 1
레코드 유형 6 1
서지형식 7 1
공란 8-9 2
지시기호 자수 10 1
식별기호 자수 11 1
데이터의 기본번지 12-16 5
입력수준 17 1
공란 18-19 2
레코드디렉토리 엔트리맵 20-23
데이터필드 길이 20 1
시작위치 길이 21 1
미사용 22-23 2
1) 레코드 길이(record lenth)
레코드의 길이는 리더, 레코드 디렉토리, 제어필드, 가변장필드를 포함한 전체길이로 숫자는 우측으로 맞추고 앞은 0으로 채운다.
예) 01543. 00543
2) 레코드의 상태(record status)
화일유지를 위하여 사용하는 한 자의 코드로 각 레코드의 상태를 나타내는 코드는 다음과 같 다.
n: 신규레코드
c: 변경된 레코드
d: 삭제된 레코드
3) 레코드의 유형(types of record)
레코드의 유형을 나타내는 한 자의 코드로 각 코드별 의미는 다음과 같다.
a: 인쇄된 레코드
b: 필사본 레코드
c: 인쇄된 악보
d: 필사본 악보
e: 인쇄된 지도자료
f: 필사본 지도
g: 영화필름 및 필름스트립
h: 마이크로자료
i: 비음향자료
j: 음향자료
k: 그림, 도면 등 이차원자료
l: 기계가독형데이터
x: 전거데이터-이름
y: 전거데이터-주제
4) 서지형식(bibliographic level)
레코드의 서지형식을 나타내는 한 자의 코드로서 사용되는 코드 및 그 의미는 다음과 같 다.
a: 분립(analytic)
m: 단행본(monograph)
s: 연속간행물(serial)
c: 전집(collection)
5) 지시기호 자수(indicator count)
6) 식별기호 자수(subfield code count)
지시기호와 식별기호의 자수는 항상 두 자이므로 각각 2가 된다.
7) 데이터의 기본번지(base address of data)
전체 레코드에서 첫번째 데이터필드의 시작위치를 나타낸다. 따라서 기본번지는 리더와 디렉토 리의 길이에 필드종료기로(field terminator)에 소요되는 한 자를 합한 수가 된다. 예를 들면 레 코드가 15개의 항목을 가진 180자 짜리 디렉토리를 갖고 있을 경우 데이터의 기본번지는 24(리 더)+180(디렉토리)+1, 즉 205가 된다. 기본번지는 다섯 자리 숫자로 표시되며 우측으로 맞추고 좌측은 0으로 채워줌으로서 위의 예에서는 00205가 된다.
8) 입력수준(encoding level)
입력된 레코드의 완선성 여부를 나타내는 한 자로 된 코드이다.
b: 완전수준, 즉 입력레코드가 자료자체를 보고 기술한 목록일때
1: 불완전수준, 즉 출판 이전의 목록 등 자료 자체를 보지 않고 기술한 목록일 때
9) 엔트리 맵(entry map)
레코드 디렉토리 엔트리의 구조를 기술하는 것으로 데이터필드의 길이는 네 자이므로 첫 자리 에는 4가 오고 데이터필드의 시작위치를 나타내는 숫자는 다섯자리이므로 둘째자리에는 5가 온 다. 마지막 두 자리는 현재는 사용하지 않으며 0으로 채워진다.
나. 레코드 디렉토리
레코드 디렉토리는 책의 목차와 같은 것으로 데이터필드부에 속하는 각 데이터필드의 길이와 위치를 지시해주는 정보를 포함하고 있으며 각 디렉토리 항목(directory entry)의 길이는 12자이 다.
각 디렉토리 항목은 아래와 같이 태그, 데이터필드 길이, 시작번지로 구성되어 있다.
+-------------+-----------------+--------------------+
| 태그 | 데이터필드 길이 | 시작번지 |
+-------------+-----------------+--------------------+
태그는 각 데이터필드를 식별하여 주는 세자리 숫자로 된 코드로 001에서 945까지 사용가능하 다. 데이터필드의 시작번지는 데이터필드부내에서의 데이터필드의 시작위치를 나타내는 상대적인 위치가 된다.
다. 제어필드
제어필드는 001에서 009까지의 태그를 사용한다. 제어필드는 지시기호와 식별기호를 사용하지 않으며 각 필드는 필드종료기호로 끝난다.
1) 001제어번호(control number)
이 필드에는 LC 카드번호가 입력된다. UK MARC에서는 여기에 ISBN이나 ISBN이 없는 경우에는 BNB번호를 입력하고 LC카드번호는 010 가변장필드에 입력한다. KORMARC포맷에서는 국립중앙도서 관의 제어번호를 사용하도록 하였다. 만일 국립중앙도서관 이외의 도서관에서 자관의 등록번호를 제어번호로 사용하고자 할 때에는 국립중앙도서관의 제어번호를 012필드에 옮기고 자관의 제어번 호를 001필드에 입력시키면 된다.
2) 008부호화정보필드
이 필드에는 부호로써 표시되는 데이터요소가 입력되며 길이는 40자이다. 각 데이터요소의 위 치와 길이는 다음과 같다.
데이터 요소 위치 길이
----------------------------------------------------------------
입력일자 0-5 6
출판년유형번호 6 1
출판년1 7-10 4
출판년2 11-14 4
출판국명번호 15-17 3
삽도부호 18-21 4
지식수준부호 22 1
복제형태부호 23 1
내용형식부호 24-27 4
정부간행물표시기호 28 1
회의간행물표시기호 29 1
기념논문집표시기호 30 1
색인표시기호 31 1
표제문단에 중복기입된 기본기입표시기호 32 1
문학형식부호 33 1
전기부호 34 1
언어부호 35-37 3
수정된 레코드표시기호 38 1
목록정보원부호 39 1
***** 아름다운프로님에 의해서 게시물 복사 + 카테고리변경되었습니다 (2003-12-18 17:01)
http://www.loc.gov/marc
MARC는 전자책 분야의 표준으로서 각국의 주요 도서관을 중심으로 발전해 오고 있다. 1960년대초 미국의 많은 도서관들의 가장 큰 문제점은 목록작업을 수작업으로 하기에는 너무 방대하다는 것이었다. 그래서 많은 도서관들은 의회도서관(LC)에 기계가독형 목록 데이터베이스를 생산하여 줄 것을 요청하게 되었다. 1966년 11월부터 1968년 6월까지의 MARC 파일럿 프로젝트기간을 거치게 되는데 그당시 LC는 영국국가서지국(BNB)과협력하여 MARC2 혹은 지금의 단지 MARC로 더 많이 알려진 새로운 레코드 포맷의 설계에 밀접한 협력이 이루어졌다. 그때당시 이 포맷이 목표로 한것은 서지 데이터의 재조직이 가능한 자기 테이프로써 서지기술을 전달하고자 하는 것이었다. 그리하여 LC는 1969년 3월부터는 MARC2포맷에 따른 MARC 테잎이 생산되어 구독을 원하는 각 도서관에 배포되기 시작하였다.
MARC를 전면적으로 시행하려면 먼저 도서관의 전 장서가 MARC 포맷의 레코드를 필요로 하게 되자 소급자료의 화일변환이 문제가 된다는 것을 알았다. 그래서 1970년 소급변환프로젝트인 RECON(Retrospective Conversion)이 미국에서 시작되기도 했다.
MARC이후에 나타난 목록시스템의 전산화의 특징은 온라인 도서관네트워크 통한 공동편목 및 목록 생산시스템의 전산화이다. OCLC, RLIN, WLN 등이 그 대표적인 예이다.
DC(Dublin Core)
DC는 네트워크 환경에서 상거래를 수반하는 모든 정보 자원을 기술하기 위한 메타데이터이며 1995년 미국 더블린 OCLC/NCSA DC 1차 워크샵에서 처음으로 성격을 규정하였다. 이 것은 MARC의 복잡한 구조에 대한 대안으로 제시되었다. 현재 15개의 메타데이터 구성 요소를 확정하였다. 확장성을 위한 한정어를 포함하며 한정어는 언어, 스킴, 하위요소 세가지로 구성된다.
MARC포맷
MARC포맷은 세가지 기본요소로 이루어진다. 첫째는 레코드의 기본구조로서 다음과 같이 리더 (leader), 레코드디렉토리(record directory), 데이터필드(data fields)로 구성되고 데이터필드 부는 다시 제어필드(control fields)와 가변장필드(variable fields)로 나뉜다.
+------------+---------------------+--------------+------------------------+
| 리 더 | 레코드 디렉토리 | 제어필드 | 가변장필드 |
+------------+---------------------+--------------+------------------------+
+-----+------+-----------+---------+--------------------+------------------+
24자 12자×데이터필드수+1 코드데이터 및 서지데이터
둘째 요소는 레코드내의 데이터를 식별하는 식별기호 내지는 식별방법으로 각각의 서지데이터 를 구별하는 세자리 숫자인 태그(Tags), 각 가변장필드에 대한 부수적인 정보를 제공하는 두자리 코드인 지시기호(indicators)가 사용된다.
셋째 요소는 데이터필드에 수록된 데이터 자체를 말한다.
가. 리더
리더는 24자로 구성되는 고정장필드로 내용은 다음가 같다.
데이터 요소 위치 길이(자수)
-----------------------------------------------------------
레코드 길이 0-4 5
레코드 상태 5 1
레코드 유형 6 1
서지형식 7 1
공란 8-9 2
지시기호 자수 10 1
식별기호 자수 11 1
데이터의 기본번지 12-16 5
입력수준 17 1
공란 18-19 2
레코드디렉토리 엔트리맵 20-23
데이터필드 길이 20 1
시작위치 길이 21 1
미사용 22-23 2
1) 레코드 길이(record lenth)
레코드의 길이는 리더, 레코드 디렉토리, 제어필드, 가변장필드를 포함한 전체길이로 숫자는 우측으로 맞추고 앞은 0으로 채운다.
예) 01543. 00543
2) 레코드의 상태(record status)
화일유지를 위하여 사용하는 한 자의 코드로 각 레코드의 상태를 나타내는 코드는 다음과 같 다.
n: 신규레코드
c: 변경된 레코드
d: 삭제된 레코드
3) 레코드의 유형(types of record)
레코드의 유형을 나타내는 한 자의 코드로 각 코드별 의미는 다음과 같다.
a: 인쇄된 레코드
b: 필사본 레코드
c: 인쇄된 악보
d: 필사본 악보
e: 인쇄된 지도자료
f: 필사본 지도
g: 영화필름 및 필름스트립
h: 마이크로자료
i: 비음향자료
j: 음향자료
k: 그림, 도면 등 이차원자료
l: 기계가독형데이터
x: 전거데이터-이름
y: 전거데이터-주제
4) 서지형식(bibliographic level)
레코드의 서지형식을 나타내는 한 자의 코드로서 사용되는 코드 및 그 의미는 다음과 같 다.
a: 분립(analytic)
m: 단행본(monograph)
s: 연속간행물(serial)
c: 전집(collection)
5) 지시기호 자수(indicator count)
6) 식별기호 자수(subfield code count)
지시기호와 식별기호의 자수는 항상 두 자이므로 각각 2가 된다.
7) 데이터의 기본번지(base address of data)
전체 레코드에서 첫번째 데이터필드의 시작위치를 나타낸다. 따라서 기본번지는 리더와 디렉토 리의 길이에 필드종료기로(field terminator)에 소요되는 한 자를 합한 수가 된다. 예를 들면 레 코드가 15개의 항목을 가진 180자 짜리 디렉토리를 갖고 있을 경우 데이터의 기본번지는 24(리 더)+180(디렉토리)+1, 즉 205가 된다. 기본번지는 다섯 자리 숫자로 표시되며 우측으로 맞추고 좌측은 0으로 채워줌으로서 위의 예에서는 00205가 된다.
8) 입력수준(encoding level)
입력된 레코드의 완선성 여부를 나타내는 한 자로 된 코드이다.
b: 완전수준, 즉 입력레코드가 자료자체를 보고 기술한 목록일때
1: 불완전수준, 즉 출판 이전의 목록 등 자료 자체를 보지 않고 기술한 목록일 때
9) 엔트리 맵(entry map)
레코드 디렉토리 엔트리의 구조를 기술하는 것으로 데이터필드의 길이는 네 자이므로 첫 자리 에는 4가 오고 데이터필드의 시작위치를 나타내는 숫자는 다섯자리이므로 둘째자리에는 5가 온 다. 마지막 두 자리는 현재는 사용하지 않으며 0으로 채워진다.
나. 레코드 디렉토리
레코드 디렉토리는 책의 목차와 같은 것으로 데이터필드부에 속하는 각 데이터필드의 길이와 위치를 지시해주는 정보를 포함하고 있으며 각 디렉토리 항목(directory entry)의 길이는 12자이 다.
각 디렉토리 항목은 아래와 같이 태그, 데이터필드 길이, 시작번지로 구성되어 있다.
+-------------+-----------------+--------------------+
| 태그 | 데이터필드 길이 | 시작번지 |
+-------------+-----------------+--------------------+
태그는 각 데이터필드를 식별하여 주는 세자리 숫자로 된 코드로 001에서 945까지 사용가능하 다. 데이터필드의 시작번지는 데이터필드부내에서의 데이터필드의 시작위치를 나타내는 상대적인 위치가 된다.
다. 제어필드
제어필드는 001에서 009까지의 태그를 사용한다. 제어필드는 지시기호와 식별기호를 사용하지 않으며 각 필드는 필드종료기호로 끝난다.
1) 001제어번호(control number)
이 필드에는 LC 카드번호가 입력된다. UK MARC에서는 여기에 ISBN이나 ISBN이 없는 경우에는 BNB번호를 입력하고 LC카드번호는 010 가변장필드에 입력한다. KORMARC포맷에서는 국립중앙도서 관의 제어번호를 사용하도록 하였다. 만일 국립중앙도서관 이외의 도서관에서 자관의 등록번호를 제어번호로 사용하고자 할 때에는 국립중앙도서관의 제어번호를 012필드에 옮기고 자관의 제어번 호를 001필드에 입력시키면 된다.
2) 008부호화정보필드
이 필드에는 부호로써 표시되는 데이터요소가 입력되며 길이는 40자이다. 각 데이터요소의 위 치와 길이는 다음과 같다.
데이터 요소 위치 길이
----------------------------------------------------------------
입력일자 0-5 6
출판년유형번호 6 1
출판년1 7-10 4
출판년2 11-14 4
출판국명번호 15-17 3
삽도부호 18-21 4
지식수준부호 22 1
복제형태부호 23 1
내용형식부호 24-27 4
정부간행물표시기호 28 1
회의간행물표시기호 29 1
기념논문집표시기호 30 1
색인표시기호 31 1
표제문단에 중복기입된 기본기입표시기호 32 1
문학형식부호 33 1
전기부호 34 1
언어부호 35-37 3
수정된 레코드표시기호 38 1
목록정보원부호 39 1
***** 아름다운프로님에 의해서 게시물 복사 + 카테고리변경되었습니다 (2003-12-18 17:01)