Kíváncsiságból én is kiadtam egy parancsot. Korosztály kb. 20-40 év.
SELECT
count(1),
split_part(email, '@', 2) AS domain
FROM lddcec
GROUP BY domain
ORDER BY count DESC
LIMIT 10;
count │ domain
────────┼─────────────────
243540 │ gmail.com
46968 │ freemail.hu
14400 │ citromail.hu
8055 │ hotmail.com
5156 │ yahoo.com
3079 │ gmail.hu
710 │ vipmail.hu
651 │ icloud.com
378 │ indamail.hu
212 │ t-online.hu
(10 rows)
Százalékosan, évekre lebontva így alakul:
WITH
t1 AS (
SELECT
split_part(email, '@', 2) AS domain,
extract(YEAR FROM created) AS year
FROM lddcec
WHERE email IS NOT NULL
),
t2 AS (
SELECT
year,
count(1) AS sum,
count(1) FILTER (WHERE domain = 'gmail.com') AS gmail,
count(1) FILTER (WHERE domain != 'gmail.com') AS non_gmail
FROM t1
GROUP BY year
)
SELECT
year,
((gmail::float / sum::float * 1000)::integer)::float / 10 AS gmail_percent,
((non_gmail::float / sum::float * 1000)::integer)::float / 10 AS non_gmail_percent
FROM t2
ORDER BY year;
year │ gmail_percent │ non_gmail_percent
──────┼───────────────┼───────────────────
2015 │ 59.4 │ 40.6
2016 │ 61.9 │ 38.1
2017 │ 65.3 │ 34.7
2018 │ 70.2 │ 29.8
2019 │ 74.5 │ 25.5
2020 │ 79.6 │ 20.4
2021 │ 82.8 │ 17.2
(7 rows)
A tendencia jól kivehető... Teljesen betegnek tartom ezeket a számokat! És a hideg futkos a hátamon, hogy a munkatársaimon és az ügyfeleinken kívül már szinte senkit nem tudok úgy megszólítani a neten, hogy a mondataim ne haladjanak keresztül az említett cég hálózatán, algoritmusain, stb...