Nagłówek - jeśli go nie widać, skorzystaj proszę z odnośników na dole strony
Stryjenka Ludwika zaprasza do wpisania się do Księgi Gości witryny - zostaw ślad po swojej wizycie
Genealogia od strony teoretycznej i praktycznej

Copyright © 1999-2010 Jacek Kubis

Nawigator: Strona główna > Warto wiedzieć > Kodowanie nazwisk

W tym dziale

Genealogia a archeologia

Genealogia polityczna

Genealogia a ochrona danych osobowych

System porządkowania danych genealogicznych

Genealogiczne systemy numerowania

Systemy kodowania nazwisk

Literatura genealogiczna

Literatura onomastyczna

Tajemnice wyszukiwarek internetowych

Kalendarze juliański i gregoriański

Systemy kodowania nazwisk

Strona 1 2

Początkujący badacze genealogiczni często pomijają istotne informacje dotyczące swoich przodków tylko z powodu różnic w pisowni nazwiska. Należy pamiętać, że nasi przodkowie i im współcześni dysponowali znacznie mniejszą wiedzą niż my i mogli się posługiwać słowem pisanym z dużo mniejszą wprawą. Do tego dochodzą sytuacje, gdy polskie nazwisko było zapisywane przez urzędnika nieposługującego się językiem polskim, a taka sytuacja miała miejsce w Polsce przez cały okres zaborów. Powodowało to zmianę pisowni nazwiska na brzmieniowo zbliżoną, ale niekoniecznie identyczną. Bardzo podobną sytuację mieli Amerykanie. Poradzili sobie wykorzystując w czasie spisów ludności system Soundex oraz odrobinę zmieniony Miracode. W ostatnich latach system Soundex został udoskonalony przez Daitch'a i Mokotoff'a. Zadaniem tych systemow jest wyeliminowanie wpływu "literówek" i zmian fonetycznych w zapisie nazwisk, a przede wszystkim ich posegregeowanie i późniejsze łatwe odnajdywanie.

Soundex System
System Soundex został wymyślony w Stanach Zjednoczonych przez Roberta Russel'a z Pittsburg'a w Pensylwanii i 2 kwietnia 1918 roku opatentowany przez niego pod numerem 1,261,167. System ten został przez Works Projects Administration (nie wiem co to była za instytucja) przekazany do wykorzystania na potrzeby Social Security Administration (Administracji Ubezpieczeń Społecznych) w 1930 roku. Ten amerykański ZUS potrzebował sposobu na zidentyfikowanie osób uprawnionych do świadczeń w okresie emerytalnym. Szczególnie dotyczyło to osób urodzonych po 1870 roku. Karty Soundex zostały utworzone dla części stanów rozpoczynając od spisu ludności z 1880 roku dla rodzin składających się z dzieci w wieku najwyżej 10 lat. System ten został użyty także w czasie spisów ludności z lat 1900, 1910 i 1920. Idea systemu Soundex opiera się o schemat przekształcający każde nazwisko w czteropozycyjny kod. Na pierwszym miejscu kodu znajduje się pierwsza litera nazwiska, a po niej następują liczby reprezentujące spółgłoski zawarte w nazwisku. Samogłoski oraz niektóre spółgłoski są pomijane. Powstały kod pozwala na odnalezienie podobnie brzmiących nazwisk.
Soundex nie został użyty we wszystkich stanach, jednak dla tych stanów gdzie był nadal dostępne są mikrofilmy w National Archives and Records Administration (NARA) - takie amerykańskie Archiwa Państwowe, większych bibliotekach, kolekcjach genealogicznych oraz w centrach Kościoła Jezusa Chrystusa Świętych Dni Ostatnich. Karty z kodami Soundex są zebrane według poszczególnych stanów, następnie według utworzonego kodu grupującego wszystkie podobnie brzmiące nazwiska. Wewnątrz danego kodu, nazwiska są ułożone alfabetycznie według imienia lub inicjałów. Przejrzenie takiej grupy nazwisk pozwala zorientować się w mnogości wariantów w jakich zbliżone brzmieniowo nazwiska mogły występować.

Sposób kodowania w systemie Soundex:

  • Kod składa się tylko z 4 znaków, np. L123, C472, S160;
  • Pierwszym znakiem kodu jest pierwsza litera nazwiska;
  • Kolejne trzy znaki powstają z przyporządkowanych im cyfr w kolejności występowania w nazwisku poniższych liter:
    • 1 (jeden) dla liter B P F V,
    • 2 (dwa) dla liter C S K G J Q X Z,
    • 3 (trzy) dla liter D T,
    • 4 (cztery) dla litery L,
    • 5 (pięć) dla liter M N,
    • 6 (sześć) dla litery R,
    • litery A, E, H, I, O, U, Y oraz W są pomijane, chyba że są pierwszą literą nazwiska, podwojone litery traktowane są jako jedna, przedrostki jak "van", "Von", "Di", "de", "le", "D", "dela" lub "du" są czasem pomijane lub łączone z nazwiskiem, gdy liczba cyfr kodujących nazwisko jest mniejsza niż 4, wówczas puste pozycje uzupełnia się zerami
[Uwaga: soundex nie uwzględnia występowania polskich znaków diakrytycznych, czyli naszych, ą, ć, ę, ł, ń, ó, ś, ź, ż; w takich sytuacjach można albo zamienić literę na "bezogonkową" albo wyobrazić sobie brzmienie nazwiska dla Amerykanina i sposób w jaki by to brzmienie zapisał]
Przykład dla nazwiska Kubis - ponieważ zaczyna się od K więc pierwszym znakiem kodu będzie K właśnie, U pomijamy, B oznaczamy cyfrą 1, I pomijamy, S oznaczamy cyfrą 2, ponieważ nie ma już więcej liter więc ostatnie czwarte miejsce uzupełniamy zerem otrzymując kod - K120,
Identyczny kod będą miały nazwiska Kubas, Kupis, które brzmieniowo są bardzo podobne.

Strona 1 2

Pomocnik
Warto wiedzieć
Imię i Nazwisko
Krewni
Badania Własne
Księga Gości
Gen-Wieści
Kontakt