Совпадение первых букв имени и фамилии — случайность или культурный артефакт?
Я проверил простую гипотезу:
Люди порой дают детям имена, начинающиеся на ту же букву, что и фамилия (например, Игорь Иванов или Mari Mets). Но как такие аллитерационные имена распределены в разных культурах? Мне показалось, что в эстонской практике это более распространено, чем в русской. Можно ли проверить эту интуицию? Это просто случайность или культурный выбор?
Я собрал реальные пары «имя–фамилия» из Википедии (категории: спортсмены, писатели, поэты, ученые, художники... политики etc,) для:
🇪🇪 Эстонии
🇱🇻 Латвии
🇫🇮 Финляндии
🇷🇺 России
(1960–2005 годы рождения)
Сначала — проверка «а вдруг это просто математика?»
Если имя и фамилия выбираются независимо, то совпадения первых букв должны возникать с определённой ожидаемой вероятностью (её можно вычислить из распределений букв).
Я сравнил:
- реальную долю совпадений
- ожидаемую при полной независимости
Что получилось
🇪🇪 Эстония
Совпадений существенно больше, чем должно быть случайно.
Разница между наблюдаемым и ожидаемым уровнем — около +4 процентных пунктов, и она статистически устойчива.
Причём эффект усиливается у младших поколений.
🇷🇺 В России наблюдается очень слабое преобладание совпадений над случайным ожиданием — порядка +1 п.п., и доверительный интервал слегка включает ноль.
Это означает, что:
- либо эффект очень слабый,
- либо он практически отсутствует,
- либо выборка не позволяет его уверенно зафиксировать.
Иными словами, Россия не демонстрирует выраженного культурного паттерна — по крайней мере в этих данных.
🇫🇮 Финляндия
Небольшой устойчивый эффект (около +1–2 п.п.), без заметного роста по когортам.
🇱🇻 Латвия
В среднем почти случайность…
но у поколения 1996–2005 — резкий скачок.
Латвийский сюрприз
У мужчин:
- 1960–80: ~2% совпадений
- 1996–05: ~27%
Проверил тремя способами (bootstrap, exact test, permutation) — это не шум малой выборки.
То есть в Латвии у младшего поколения мужчин действительно произошёл перелом.
(Для женщин в этой когорте данных слишком мало для выводов. Патриархат такой патриархат.)
Главный вывод
Аллитеративные имена — это не просто статистическая случайность.
В Эстонии — устойчивый и усиливающийся культурный эффект.
В России — если эффект и есть, то он слабый и пограничный.
В Финляндии — небольшой стабильный уровень.
В Латвии — поколенческий сдвиг, особенно выраженный у мужчин.
Если кому интересно проверить расчёты — полный архив с исправленными данными и bootstrap-результатами прилагается.
Буду рад, если кто-то с более продвинутым пониманием статистики посмотрит и скажет, где я, собака ChatGPT, ошибся — или где результат особенно интересен!