Name & Entity Resolution

出典: Fukudat


目次

日本人名の正式な読みについて

日本人の名前は漢字で書かれることが多く,漢字の名前には複数の読み方があることが少なくない.

の名前は「剛志」で「たけし」と読むのが正しいことにしているが,「新庄剛志」は「つよし」と読むし,「内藤剛志」は「たかし」と読むらしい.他の読み方もありえるだろう.では,何をもって「正しい」読みと言うのだろう.

役所に出す出生届には「よみかた」の欄があり,出生時に命名した名前の読みを届け出ることになっている.これが「正しい」名前の読みと考えるのが普通だろう.

しかし,出生届の用紙の「記入上の注意」には,「よみかたは,戸籍には記載されません。住民票の処理上必要ですから書いてください。」と書かれている.この注意から分かるように,基本的には戸籍には名前の読みは載らない.住民票にも「処理上必要」なだけで実は記載されないのだ.

古くは,出生届の「その他」の欄に「傍訓記載希望」などと書いておくと,戸籍上も傍訓(振り仮名)が記載されていた(昭和56年9月14日法務省民二第5537号民事局長通達). しかし,1994年11月より,戸籍にはいっさい傍訓を記載しないこととなった(平成6年11月16日法務省民事局第2課第7005号民事局長通達).

したがって現在では,名前の読みはあくまでも住民票の「処理上」ということで,住民票の原本(すなわち住民基本台帳)検索などで使用される.このほか,選挙人名簿は住民基本台帳をベースにして作成されるが,その中には名前の読みがついている.

このように,人名の正式な読みを確認するための公的な証明書や文書は存在しないか,入手困難である.銀行口座を開くときも,何かに会員登録するときも必ずといってよいほどたずねられる名前の読みだが,正式な読みには根拠が希薄であるように思われる.

マッチングアルゴリズム

  • Soundex
  • Damerau-Levenshtein distance

日本語 Name Parser

リンク集