Головна

Статистика імен та народжень
 
Отже, ще один звіт – Статистика. Передісторія появи наступна.
Іноді потрібно знайти народження конкретної персони, але рік та (або) точне місце її народження невідомі. Гіпотетично, можна не переглядати всі метрики поспіль (а в архіві, як зазвичай цейтнот часу), а подивитися лише за період, близький до днів іменин цього імені.
Але всі спроби свого часу знайти "дні янгола" для імен не увінчалися успіхом. Імена в таких списках зазвичай не вживаються в дореволюційний час (Ізольди, Ізабелли, Клеопатри, Аврори, Аполлони і т.д.). Крім цього, так і не знайшов однозначного трактування за скільки днів до і після іменин було прийнято називати немовлят. І ще в таких календарях є безліч днів одного імені, а називають зазвичай лише деякі з них, як правило святих або відомих.
Тоді й народилася ідея робити вибірку за фактично існуючими даними та отримати реальну картину з цього питання.
І ось що вийшло.

Вибірка на ім'я Євдокія ( Аналіз виконується по всій базі даних і в даному випадку не важливо на якому записі знаходиться курсор у списку персон
) :

 
Микола (Николай):


Наталія (вірніше введено "Натал*", щоб потрапили і " Наталя " і "Натал ія" і "Наталья"):


Відразу хочу попередити, що якщо у вашій базі менше, як мінімум, кількох тисяч людей або якщо вони народилися не раніше, ніж 100 років тому, то побудова за нею статистики мало що вам дасть, оскільки після революції називати немовлят за святками не було прийнято і побудова статистики, включаючи ці роки, буде не показовою. Для цього у звіті є фільтр за датами.
Принагідно, ідея звіту згодом була розвинена, додана можливість виведення не лише дат народження, а й смерті, доданий спосіб угруповання даних.
Крім угруповання за датами є можливість згрупувати дані з років, тобто. скільки на який рік потрапляло народжень-смерті (наприклад, для аналізу епідемій тощо).
Також можна дослідити статистику за іменами (їх різновидами). 
Крім цього для вибірки статистики також можна застосувати фільтри за статтю та прізвищем (її частини), якщо раптом таке знадобиться.

От приклад отримання статистики за іменами:

Зверніть увагу, що якщо навести курсон на будь-який стопчик, та натиснути кнопку мишки, то отримаємо інформацію по ньому: значення, по якому діаграма групувала дані,та кількість випадків (виділено жовтим).

Також під час фільтрації по імені або прізвищу можна користуватися символами "*" (один або кілька будь-яких символів) та "?" (один будь-який символ).

Це може знадобитися, коли у вас в данних не уніфіковано імена, а їх записано так, як вони трапилися в оригіналі (у мене таке, все до ладу не приведу). Таким чином можемо глянути, наприклад, скільки різновидів написання у даних варіантів від імені Іван, скориставшись маскою: "И*ан*"


У ході розробки звіту та його налагодження звернув увагу на цікавий факт, розгадки якого не знайшов.
Якщо зробити вибірку за датами народження за всіма іменами, то на графіку можна спостерігати факт того, що в останні дні місяця зазвичай було зареєстровано дуже мало народжень.
У той же час, на початку місяця був їх сплеск? Найімовірніше, що народилися наприкінці місяця, писали на початок наступного.
Чи є у когось ідеї щодо пояснення цієї закономірності?