@article{oai:rekihaku.repo.nii.ac.jp:00000515, author = {水藤, 真 and Suitō, Makoto}, journal = {国立歴史民俗博物館研究報告, Bulletin of the National Museum of Japanese History}, month = {Nov}, note = {application/pdf, この「記録類の全文入力の試み」というのは,日記や編さん物の全文をコンピューターに入力して,その検索・統計などの用途に益ならしめようとするものである。例えば,「祭」という言葉が何という日記の何年何月何日条に出て来るかを,コンピューターを使って,瞬時に知ることは出来ないか,などという期待を実現出来ないかという試みである。 当然,過去に記された日記には色々な特徴があり,コンピューター化に適したものとそうでないものがある。例えば,日記に記された文章は,それぞれの日にちで長さが異なる。また,文章の途中に書き直したものや,後で追記されたものが挿入されるとか,また現在では使われていない文字が使われているとか,様々なことがあり,単純にただ文章をコンピューターに打ち込めば良いというものではない。この為の諸条件の整備が最初の難関であった。 次には,コンピューターの操作が難しいという問題があった。 こうして,いくつかの関門を突破しつつ,次の努力目標を掲げた。 誰でもが使えるような易しいシステムであること。あらかじめキーワードを準備するのでなく,任意の文字列で検索出来ること。この2点である。こうしてシステムは兎も角動くようになった。しかし,一旦稼働することが分かると,次には新たな問題が持ちあがった。例えば検索の為の時間である。当初,時間はいくらかかっても,任意の文字列で検索出来ることを至上目標とした。当然の結果とはいえ,時間は40万字の検索で12,3分を要することとなった。それでも,初めて検索結果の出来た時は感動であった。しかし,2度,3度と異なる言葉を検索しようとした時,これではかなり障害となる。そこで今度は時間短縮を計ることが重要課題となった。そして,今,1件当り約1,2分で検索出来る。本稿はこの悪戦苦闘の記録である。, This “attempt at a total input of records” aims to utilize the full text of diaries and compilations for retrieval and statistics by inputting them into a computer. This is an attempt to be able to know immediately, for example, in what article of what date the word “festival” appears in a diary, by using a computer. It is natural that diaries so far written have a variety of characteristics. Some are suitable for input, but others are not. For example, the length of sentences written in diaries differs day by day. Some were rewritten or inserted after the original was written, and some include Chinese characters which are not used today. Therefore, it is not simply a matter of inputting sentences. The first barrier was the arrangement of conditions for input. The second one was the difficulty of computer operation. Anyway, the following two goals were set, and some barriers overcome. The system must be easy to operate so that anybody can use it. Data must be retrievable by any optional character string, without preparing keywords in advance. At last, the system started operating : But once it started, new problems occurred, for example, the time required for retrieval. At first, the ultimate goal was to be able to retrieve data by any optional character string for any length of time. As a result, the system was found to take 12 or 13 minutes for a retrieval from 400,000 characters. I was excited when I succeeded in retrieving data for the first time, but this length of time was a considerable barrier to the repeated retrieval of data by more than one word. Then, the curtailment of retrieval time became an important task. Now retrieval time has been reduced to only one or two minutes. This paper is the record of this hard struggle.}, pages = {333--353}, title = {記録類の全文入力の試み : 『石山本願寺日記』を素材に(Ⅱ. 歴史研究と博物館)}, volume = {35}, year = {1991}, yomi = {スイトウ, マコト} }