Евгений Козлов пишет про IT

Public

Просмотреть канал

Не можете присоединиться? @careerunderhood

2.9k Участники

Обновлено: May 7, 2026 at 8:16 PM

Евгений Козлов пишет про IT

14 лет пишу код, 10 - в прод. Руковожу командой инженеров в Т-Технологиях. 📌 Backend, Data, System Design 📌 Concurrency, Performance, Algorithms 📌 Infrastructure, Reliability 📌 Карьера, Менеджмент Для связи: @ea_kozlov

@careerunderhood is a dedicated channel for performance and reliability with regular updates in Кодинг и программирование

Рейтинг

Глобальный рейтинг

#456

Рейтинг по языку

#45

Рейтинг по категории

#23

-1

Рост участников (Последние 3 дней)

Всего: 2.9K

Рост за 24ч: +0 0%

Последние посты

Евгений Козлов пишет про IT

3 мая 2026 г., 07:12

📷 Photo

moz://a SSL Configuration Generator

Вижу по статистике и реакциям - что последний пост вам зашел, поэтому решил эту неделю посвятить лайфхакам и прикладным инструментам по безопасности. Ранее я совсем на эту тему не писал в канале, сплошной Software Engineering & Computer Science 🙂. Хотя мне есть чем поделиться, так как приходилось уделять время этому аспекту.

Допустим, сервер мы купили, настроили как положено. Что делать дальше? Правильно - задеплоить туда приложение. https://github.com/beagreatengineer/how-to-develop-perfect-crud?tab=readme-ov-file#deployment. Справимся. Остается завершающий этап - публикация в интернет. И тут начинается интересное. По современным гайдлайнам и политикам безопасности любой ресурс в интернете должен работать по связке HTTPS + TLS.

На этом шаге легко словить ступор и вообще забросить затею публикацию, или же забить и опубликовать все как есть (не надо). Можно конечно пойти советоваться с LLM, но это на свой страх и риск и наличие времени на перепроверку.

Лично мне с задачей настройки безопасных соединений в разных видах ПО помогал портал от Мозиллы https://ssl-config.mozilla.org/. Скриншот для ознакомления прилагается.

Как сейчас помню настройку Nginx для магистерской диссертации.

Расскажите в комментариях, как вы настраивали HTTPS для своего первого сайта?😊

1,550

Евгений Козлов пишет про IT

3 мая 2026 г., 07:12

How To Secure A Linux Server

Сейчас мы живем в удивительное время. С одной стороны все больше слоев абстракции над нашими компьютерами. Если раньше ОС считалась абстракцией над железом то сейчас мы вовсю работаем с виртуализацией всех видов и декларируем свои намерения в YAML не зная вообще конфигурации сервера.

С другой стороны в последнее время как будто бы нам все чаще нужны личные виртуалки у хостинг-провайдера или даже собственный сервер дома. Кому то хочется приватности, кому-то контроля. А ещё есть те кто стремиться глубже погружаться в то как устроены вещи😊 Но здесь мы встаем на путь работы с голой ОС и отвечаем не только за развертывание приложения, но и общую безопасность.

Когда я был джуном я вовсю работал с разного рода серверами, писал скрипты и даже отвечал за инфру небольших продуктов (вся инфра умещалась на одном сервере😊).

Как следствие - чтобы справляться с вызовами на работе приходилось активно самообразовываться в теме безопасности. И тут мне здорово помогал (и помогает до сих пор) GitHub. Поначалу бездумно копируя, что уж греха таить, но со временем все больше понимая и вникая в суть советов я овладел навыком настраивать относительно защищенный сервер, за который не страшно.

В общем, хочу с вами поделиться - https://github.com/imthenachoman/How-To-Secure-A-Linux-Server

Гайд лежит в моих закладках уже лет 6 точно, и что приятно - он эволюционирует и пользуется популярностью в сообществе. Самообразовывайтесь, пусть на ваших виртуалках никто не майнит бетховены и не рассылает спам😁

2,690

Евгений Козлов пишет про IT

3 мая 2026 г., 07:12

Concurrency, Synchronization and Consistency. Иерархия накладных расходов.

Спустя время глядя на цикл постов понял что в нем не хватило отдельного саммари c выводами о том как добавление синхронизации и согласованности влияет на производительность. Концептуальным проблемам мы посвятили достаточно времени, а перформансу можно было и побольше.

И в этот момент мне совершенно случайно попалась https://travisdowns.github.io/blog/2020/07/06/concurrency-costs.html, в которой автор буквально делает тоже самое, что и я в цикле постов - препарирует шаг за шагом механизмы синхронизации и демонстрирует бенчмарки. Она и подтолкнула меня к написанию бонус-поста.

Задача - безопасно, согласованно и максимально быстро работать из нескольких потоков c переменной uint64, как со счетчиком. Бенчмарки собрать с 4 разных процессоров.

Bench №1 - Блокирующая синхронизация / атомики.

Самая наивная из возможных реализаций - использовать Mutex. Бенчмарки говорят - стоимость одной операции += для программы из 2х потоков - 125 наносекунд. И чем больше потоков тем дороже операция. Подобное поведение мы уже рассматривали в

Можно ли сделать лучше? Да, например избавиться от мьютекса и взять:
- атомарный uint64 и явно использовать Compare and Swap.
- атомарный uint64 и довериться компилятору.

Получилось неплохо, из интересного - CAS оказался на том же уровне что и мьютекс.

Bench №2 - Бутылочное горлышко системных вызовов

Автор реализует Ticket lock используя atomic + sched_yield(2) syscall. С помощью аналогичной связки я https://habr.com/ru/articles/956690/ Получается еще хуже чем в первом бенче, оно и понятно почему - больше взаимодействия с ОС. В настоящем мьютексе сделано поинтереснее, рассказывал об этом и в статье про самописный mutex.

Bench №3 - Неявное переключение контекста

Автор идет дальше и предлагает 2 варианта как бы еще подступиться:
- condvar которая бы позволила засыпать и пробуждать все ожидающие потоки
- честная блокировка с очередью потоков. Почему называется честной - потому что ресурс передается строго в порядке в котором на него претендовали потоки.

Первый вариант демонстрирует проблему thundering herd, так как мы пробуждем все потоки, а захватит ресурс только один, а остальные сожгут CPU и снова уснут. Можно былои не будить вовсе.

Второй справился лучше. Ведь мы решили проблему thundering herd. Но всё равно никуда не годится, так как у этой реализации другая проблема - lock convoy.

Bench №4 - 0 переключений контекста (без учета прерываний ОС)

Что если sched_yield(2) заменить на ; и как следствие не отпускать ядро до момента пока у потока его не заберет ОС? Катастрофа и переход от наносекунд к микросекундам.

Что мы видим? С каждым бенчем все хуже и хуже. Ощущение, что лучше чем стандартный атомик сделать невозможно. Но тут автор явно говорит - хватить демонстрировать проблемы, давайте попробуем сделать что-то реально классное. И сделал.

Bench №5 - Шардируемый счетчик

Если наша цель выжать максимум из рантайма нам нужно явно избегать конкуренции между ядрами за какие либо ресурсы. И чтобы этого добиться нужно явно код программы адаптировать к нашему железу. Автор продемонстрировал реализацию счетчика которая побеждает все предыдущие бенчмарки.

-----

Если подытожить - на перформанс корректного многопоточного приложения посягают:
- мьютексы со своей нелинейной масштабируемостью по количеству ядер;
- атомики и ассемблер. CAS и FAA инструкции;
- системные вызовы к ОС;
- явные и неявные переключения контекста.
- потребность иметь в программе строгий порядок и честность (lock convoy problem).
- наличие логики создающей ситуацию когда потоки циклически пытаются захватить ресурс, но чаще терпят неудачу (thundering herd problem).

И всего этого можно избежать заплатив цену. Что автор и продемонстрировал. Предлагаю вам взглянуть на код в конце статьи и ответить в комментариях - затащили ли бы вы подобное в production?

Евгений Козлов пишет про IT

3 мая 2026 г., 07:12

Concurrency, Synchronization and Consistency. Пост № 24. Подводим итоги. Что будет дальше?

Пришло время подводить итоги, так как мы рассмотрели основные вызовы и челленджи:

- Начали от самых основ связанных с железом и тем как устроена ЭВМ.
- Углубились в детали работы процессора, рассмотрели как он эволюционировал со временем, какие трюки и идеи реализовывали инженеры для ускорения.
- Рассмотрели цену каждой такой идеи, ее влияние на программиста и код.
- Рассмотрели инструменты и примитивы позволяющие программистам писать корректные программы и обходить особенности разных моделей памяти.
- Ну и напоследок рассмотрели концептуальные проблемы порождаемые многозадачным программированием.

Могу сказать точно - написание цикла постов меня здорово прокачало. Я увидел на практике, что многие вещи которые упоминаются в кабанчике Клеппмана или распределенных системах Таненбаума присущи не только когда у тебя 2 отдельных ЭВМ, но и когда у тебя 2 или более ядер процессора в рамках одной машины.

О чем буду писать дальше?
С точки зрения хардов мне теперь интересно погрузиться в неблокирующую синхронизацию. Для меня пока это по большей части модное слово которым описывают что-то очень сложное и клевое. Хочется разобраться без прикрас, как обстоят дела на самом деле (вангую что там будет много про атомики).

А дальше на этом багаже можно:
- Вернуться к Distributed Systems, "подняться повыше по уровню абстракции"🙂
- На примере какой нибудь OLTP СУБД показать за счет чего работает магия WAL / MVCC / ACID.

Если у вас есть идеи что еще можно рассмотреть, не стесняйтесь, пишите в ЛС или комментарии.

———

Спасибо вам, что читали. Буду рад если оставите комментарий с обратной связью по материалам. Мб чего-то не хватило или недостаточно подробно разобрал. Ну и по традиции - материалы пригодившиеся во время написания постов:

Hardware
🔥 https://linux-kernel-labs.github.io/refs/pull/183/merge/lectures/smp.html - лекция по ядру Linux объясняющая SMP и то как он реализован в ядре.
🔥 https://contentxseed.com/explain-the-von-neumann-architecture/- очень простым языком про архитектуру Фон-Неймана.

Cache Coherency
🔥 https://software.rajivprab.com/2018/04/29/myths-programmers-believe-about-cpu-caches/ - еще раз о том почему важно знать как устроен процессор.
🔥 https://blog.jyotiprakash.org/a-primer-on-cache-coherence-protocols - подробный гайд про протоколы когерентности.

Mutexes / Spinlocks / Semaphores / RWMutex
🔥 https://kprotty.me/2022/09/19/building-a-tiny-mutex.html - название говорит само за себя.
https://developer20.com/memory-wall-problem/ https://eli.thegreenplace.net/2018/basics-of-futexes/ - про те самые "быстрые" мьютексы на уровне ядра Linux поверх которых пишутся мьютексы в языках программирования.
https://developer20.com/memory-wall-problem/ https://zephyrtronium.github.io/articles/rwmutex.html + https://uvdn7.github.io/shared-mutex/ - два гайда дающих полную картину по плюсам и минусам RWMutex.

Memory Models
https://developer20.com/memory-wall-problem/Memory Model and Synchronization Primitive https://www.alibabacloud.com/blog/memory-model-and-synchronization-primitive---part-1-memory-barrier_597460?source=post_page-----9585e50b4735--------------------------------------- + https://www.alibabacloud.com/blog/memory-model-and-synchronization-primitive---part-2-memory-model_597461?spm=a2c65.11461447.0.0.457c198c5hd5HF
https://developer20.com/memory-wall-problem/ https://research.swtch.com/mm by Russ Cox (Go tech lead at Google)

False Sharing
https://developer20.com/memory-wall-problem/ - статья про канонический пример демонстрирующий false sharing (обход матрицы)

📖

Евгений Козлов пишет про IT

3 мая 2026 г., 07:12

📷 Photo

The Missing README: A Guide for the New Software Engineer

В этом году я решил сделать над собой волевое усилие и читать чуть чаще чем в прошлом. И первой книгой в 2026м году стала The Missing README. Она произвела на меня впечатление, и мне хочется поделиться им с вами.

В чем посыл книги?

The Missing README позиционирует себя как книга о том что же такое Software Engineering и как же выглядит тот самый Software Engineer. Считаю, что посыл у книги благородный, так как высшее образование сфокусировано на фундаментальных дисциплинах и не на каждой специальности есть возможность адаптировать программу под запросы стремительно развивающихся технологий. Книги и независимые авторы это способ кое-как угнаться😊

Из чего состоит работа SWE?

Каждая глава книги посвящена одному аспекту, перечислю:
- Работа с кодом.
- Работоспособный код.
- Управление зависимостями.
- Тестирование.
- Ревью кода.
- Доставка (Деплой) ПО в общем и кода в частности.
- Дежурства.

В конце книги авторы уделяет время в том числе и архитектуре:
- Как устроен процесс проектирования. Как оформляется документация. Предлагается простой шаблон архитектурного документа.
- Подсвечивается основная проблема в разработке ПО - неопределенность и как с ней бороться. Как работать эволюционно с API и СУБД.

Как видите список довольно объемный. Мне понравилось, что авторы объясняют вещи простым языком, в каждой главе есть разделы "Best Practices" и "Bad Practices". Для начинающего разработчика такие вещи помогут сориентироваться во всем многообразии вариантов.

Особенно неожиданно и приятно было увидеть отдельную главу про дежурства.

Важность soft skills для инженера

Я был очень рад увидеть в книге отдельные главы о параграфы о том зачем расти инженеру в таких областях:
- Коммуникация.
- Лидерские качества.
- Проактивность. Надежность. Доверие.
- Умение учиться.
- Умение задавать вопросы.

Понятное дело, что сейчас уже об этом из каждого утюга вещают, но авторам от меня лайк за то что не сфокусировались только на хардах в книге.

Взаимодействие с менеджерами. Планирование. Построение карьеры

На десерт авторы оставляют главы о росте. Рассказывают про 1-1, как на них приходить. Как задавать тон беседе, что подсвечивать. Упоминают Situation-Behavior-Impact фреймворк для обратной связи. Помимо этого обсуждаются вопросы смены работы и распределения сил.

Кому и зачем я советую прочитать книгу

The Missing README - настоящее золото для инженеров только-только закончивших универ или курсы. Также она пригодится переходящим из небольших компаний или фриланса в компании с сотнями или тысячами инженеров. Благодаря ей вы действительно поймете, что из себя представляет промышленная разработка ПО, получите в свое распоряжение дорожную карту для развития на ближайшие несколько лет.

Если вы уже опытный - будет полезно полистать (как это сделал я) ведь повторение - мать учения.

Эта книга однозначно попадает в мой топ для инженеров наряду с:
- 📖 - 📖

Евгений Козлов пишет про IT

3 мая 2026 г., 07:12

Провожаем 2025й, встречаем 2026й

30е числа декабря это время когда многие подводят итоги, ставят цели и формируют планы на будущее. Признаюсь честно - далек от этого. Я редко ставлю себе детализированные планы, скорее ставлю себе некоторые направления в которых двигаюсь. Многие вещи и идеи могут появиться по ходу и оказаться не менее интересными и ценными чем то что изначально запланировал.

Мой 2025й был насыщенным на разные события. Даже слишком. А ещё оказался наверное самым сложным за всю мою "взрослую жизнь". Сижу, пишу пост и понимаю - отдал все свои силы без остатка.

Несмотря на это подвести итоги нужно. Усталость пройдет, а вот воспоминания и события могут стереться из памяти со временем. Мне этого не хочется🙂 Да и я вас в этом году не очень то и баловал постами про себя, очень много хардовых хардов, и почти ничего личного. Поэтому пусть будет.

———

Q1 2025
🎉 Отметил 30летие в кругу близких людей. Родители провели тайную операцию и приехали втихую ко мне в Питер.
📺 Был ведущим книжного клуба. Вместе с ребятами провели 10 встреч, прочитали .
✍️Закончил первый по настоящему долгий (писал на протяжении 6 месяцев). Очень глубоко прокачался сам и старался прокачивать вас.
🎒 В первый раз в жизни пошел учиться на IT курс. Получил сертификат.
🎁 В первый раз в жизни по настоящему выиграл в лотерею. ФК Спартак Москва подарил мне PS 5 PRO 🎮

Q2 2025
🏠 Достиг цели к которой долго шел - купил большую квартиру в СПБ. Залез в долги, но к концу года расплатился😁
📺 . До этого побывал в гостях
✈️ Путешествия: побывал в Екатеринбурге.

Q3 2025
🎤Выступил на ИТ фестивале Сезон Кода в СПБ и c докладом про технические вызовы преодоленные за годы работы над Statist.
✍️Начал новый посвященный согласованности и синхронизации.
✈️Путешествие в Великий Новгород. Памятник тысячелетию Руси оставил сильное впечатление.
✈️Путешествие в Мурманск. Одно из самых запоминающихся путеществий в жизни. Северное сияние, путешествие по островам на вертолете.

Q4 2025
💪 Провел своей команде второе Performance Review как руководитель. Поучаствовал в реорганизации процессов и орг. структуры нашего отдела. В формировании целей и дальнейшей стратегии.
✈️Путешествия: Ереван. Армения оставила приятные впечатления, рассчитываю посетить еще как минимум один раз🙂
🎒Выступил в родной школе (п.г.т. Красная Гора Брянской области) с докладом о программировании и карьере разработчика.
✍️ https://habr.com/ru/users/lebron32rus/articles/
———

Отдельно хочется отметить проект на работе:

📈 За год мы выросли примерно в 5 раз по нагрузке и объемам и это требовало от меня и команды сопоставимого роста по навыкам и усилиям. Много чего оптимизировали и ускорили, чтобы оставаться такими же эффективными и для клиентов все работало также классно как и в 2024м.

👨‍💼Я примерял на себя новые зоны ответственности. Техническое лидерство в продукте. Коммуникация с основными потребителями. Планирование миграций, Capacity Management.

🤼‍♂️Несколько членов моей команды получили повышения. Считаю это хорошим знаком и показателем, что проект важный и ценный, и в нем есть где себя проявить.

———

Чего хочу пожелать себе в 2026м:
- Постараться находить больше времени и сил на посты в канале.
- Поработать над подачей материала, чтобы зарождалась дискуссия. Мне этого очень не хватает. Пока не знаю как этого достичь без неискреннего кликбейта.
- Чаще говорить слово нет. Беречь свое время и силы. Проанализировать куда уходил ресурс в 2025м году, и не допустить повторения в 2026м.
- Вернуться в менторство. Пауза затянулась и мне это не нравится.

———
Фух, хорош😁

Дорогие подписчики, я поздравляю Вас с наступающим Новым годом и Рождеством. Желаю достижения всех намеченных целей, при этом с удовольствием и наслаждением от процесса.

Вкусно кушайте, набирайтесь сил в кругу близких людей, чтобы в новом году всё сложилось волшебно!

Евгений Козлов пишет про IT

3 мая 2026 г., 07:12

📷 Photo

Concurrency, Synchronization and Consistency. Пост № 23. Priority Inversion или баг случившийся на Марсе (реально)

Что-то я увлекся рассказами про мьютексы и совсем забыл что не довел . Возвращаю должок, рассмотрим интересную задачу из реальной жизни.

🔵 Ситуация
У нас есть 3 потока и каждому назначена своя задача (псевдокод для простоты):
Thread L (low priority):
lock(mutex)
do_some_work()
unlock(mutex)

Thread H (high priority):
lock(mutex)
critical_work()
unlock(mutex)

Thread M (medium priority):
while true:
do_cpu_work()
Что происходит:
- L стартует первым -> захватывает mutex
- H стартует вторым -> пытается захватить mutex -> блокируется, ждёт L
- M стартует третьим -> вытесняет L (приоритет выше) -> крутится на CPU

Итог:
- L не получает CPU, не может освободить mutex.
- H ждёт L, но L вытеснен M.

Следствие: Неэффективная работа программы. Как вы уже поняли из названия эта ситуация и есть инверсия приоритетов - проблема в многозадачных системах, когда задача с высоким приоритетом вынуждена ждать выполнения задачи с низким приоритетом, владеющей необходимым ей ресурсом (мьютексом).

На первый взгляд выглядит странно. В обычных задачах на работе нам не нужно знать про приоритеты потоков. Плюс вытесняющий планировщик выручает переключая контекст и выделяя всем время поработать. Вроде проблема, а вроде и нет🙂

Ответ: Если бы такая ситуация случилась на каком нибудь устройстве от которого ожидают работы в реальном времени то это могла бы быть катастрофа. И такие провалы имеют место в реальности, например на Марсе в 1997м году. Рассказывать долго не хочу, https://habr.com/ru/companies/pvs-studio/articles/315496/.

🔵 Как разрешить Priority Inversion?

1️⃣ Запрет прерываний в критических секциях

Первое что приходит в голову - запретить прерывать поток находящийся в критической секции (помним что у нас вытесняющее планирование и ОС может прервать поток в любой момент). Но доступна такая магия только в kernel space, поэтому и используется трюк обычно:
- В драйверах для атомарного доступа к hardware registers.
- В критических секциях ядра, чтобы избежать прерывания и race conditions.

Нам нужны механизмы влияния в user-space, поэтому идем дальше.

2️⃣ Протокол пороговых приоритетов (priority ceiling protocol, PCP)

- Каждый mutex имеет "потолочный приоритет" - максимальный приоритет всех потоков, которые могут его захватить.
- Когда поток захватывает такой mutex его приоритет временно повышается до потолка mutex. Это предотвращает вытеснение потока средними по приоритету задачами.
- Когда поток освобождает mutex приоритет возвращается к исходному.

Реализация в POSIX:
pthread_mutexattr_setprotocol(&attr, PTHREAD_PRIO_PROTECT);

3️⃣Протокол наследования приоритетов (priority inheritance protocol, PIP)

Когда H ждёт mutex, который удерживает L:
- L временно получает приоритет H, пока не освободит mutex.
- После unlock приоритет L возвращается к исходному.

Реализация в POSIX:
pthread_mutexattr_setprotocol(&attr, PTHREAD_PRIO_INHERIT);

🔵 Что выбрать, PIP или PCP?
- PIP защищает от priority inversion, но допускает deadlock. Довольно просто реализуется, есть везде.
- PCP более строгий, предсказуемый, предотвращает priority inversion и deadlock. Его основной минус - избыточное повышение приоритета. Сложнее в реализации и поддержке.

В реальной жизни используют PIP для стандартных приложений на Linux/RTLinux и PCP для safety-critical embedded или RTOS.

—————

Фух, думаю на этом остановиться. Основные проблемы Concurrency (Deadlock, Race Condition, Readers-Writers, Busy Waiting, Priority Inversion) в рамках цикла постов мы рассмотрели.

Осталось несколько тем и цикл можно завершать. Спасибо что читали, буду рад вашим реакциям и комментариям!

📖

Евгений Козлов пишет про IT

3 мая 2026 г., 07:12

Concurrency, Synchronization and Consistency. Пост № 22. Пример False Sharing в многопоточной программе.

В последних постах было много текста и сложных материй. И не было примеров кода. Продемонстрировать RWMutex bottleneck довольно сложно(нужен процессор с большим количеством ядер, чем больше тем лучше). Но у меня все равно появилась идея как продемонстрировать False Sharing в Concurrency.

🔵 Show me code
Представим что у нас есть программа с atomic переменной, которую мы хотим увеличивать.

func worker(v *atomic. Int32, wg *sync. WaitGroup) {
for i := 0; i < 100000000; i++ {
v. Add(1)
}
if wg != nil {
wg. Done()
}
}


Напишем две версии программы.
- последовательная, в одной горутине работаем по очереди с каждым атомиком.
- параллельная, каждой горутине выдаем свой атомик.

🔵 Последовательная версия

var a, b, c, d, e atomic. Int32
list := []*atomic. Int32{&a, &b, &c, &d, &e}

for _, atom := range list {
worker(atom, nil)
}


Статистика по времени работы (time ./main)

0.84s user
0.01s system
99% cpu
0.851 total

Итог: Загрузили одно ядро на 1 секунду. Ничего особенного.

🔵 Параллельная версия

var a, b, c, d, e atomic. Int32
list := []*atomic. Int32{&a, &b, &c, &d, &e}

var wg sync. WaitGroup
wg. Add(5)

for _, atom := range list {
go func(atom *atomic. Int32) {
worker(atom, &wg)
}(atom)
}
wg. Wait()


Статистика

35.66s user
0.08s system
470% cpu
7.588 total

Итог: 5 ядер загрузили и при этом программа работала 7+ СЕКУНД. Не такого результата мы конечно ожидали.

🔵 Что же такое этот False Sharing?

Запустим код:

var a, b, c, d, e atomic. Int32
fmt. Printf("address of a: %p\n", &a)
fmt. Printf("address of b: %p\n", &b)
fmt. Printf("address of c: %p\n", &c)
fmt. Printf("address of d: %p\n", &d)
fmt. Printf("address of e: %p\n", &e)

Вывод:

address of a: 0x140000100a0
address of b: 0x140000100a4
address of c: 0x140000100a8
address of d: 0x140000100ac
address of e: 0x140000100b0


Видим что адреса переменных находятся рядом, в 4 байтах друг от друга. И это причина по которой многопоточная версия работает хуже.

Несмотря на то что у нас каждой горутине выделена своя переменная и в коде они не зависят друг от друга у нас есть есть точка синхронизации - кеши CPU. Каждое ядро кеширует не только значение своей переменной, но и значения остальных переменных - потому что кеширование осуществляется блоками, обычно по 64 Bytes. Их называют кеш-линиями. Отсюда и неявные доп. расходы на синхронизацию (хотя в коде у нас нет ничего подобного) и как следствие увеличение времени работы.

🔵 Как починить False Sharing?

Чтобы горутины работали независимо,нужно чтобы в одну кеш линию помещалась только одна переменная. Обернем в структуру и добавим ей байт до размера кеш линии (техника называется padding).

type PaddedInt32 struct {
value atomic. Int32
_ [60]byte
}

func worker_padded(v *PaddedInt32, wg *sync. WaitGroup) {
for i := 0; i < 100000000; i++ {
v.value. Add(1)
}
if wg != nil {
wg. Done()
}
}

func main() {
var a, b, c, d, e PaddedInt32
list := []*PaddedInt32{&a, &b, &c, &d, &e}

var wg sync. WaitGroup
wg. Add(5)

for _, atom := range list {
go func(atom *PaddedInt32) {
worker_padded(atom, &wg)
}(atom)
}

wg. Wait()
}


Статистика:

1.23s user
0.01s system
447% cpu
0.275 total


🔵 Выводы

Мы смогли добиться эффективного параллелизма, но заплатили цену - явное "подстраивание" кода программы под железо. В обычной разработке мы редко прибегаем к подобным трюкам. Нам это попросту не нужно, так как наши программы чаще всего io bound. Да и не в каждом продукте достаточная нагрузка.

А вот для больших компаний подобные вещи - экономия сотен тысяч долларов. И если зарплата программиста становится менее значимым фактором чем затраты на инфру внесение вот таких изменений в программу и глубокое профилирование становится оправданным шагом. Для разработчиков СУБД, языков программирования, системных программистов такие трюки это часть жизни.

Спасибо что читали, буду рад вашим реакциям и комментариям!

📖

Евгений Козлов пишет про IT

3 мая 2026 г., 07:12

Concurrency, Synchronization and Consistency. Пост № 20. Масштабируемость Read-Write блокировки. False Sharing. В прошлом посте мы с вами разобрались с основными моментами RW примитивов. Как и обещал - переходим к практике. У RW блокировок в классической…

1,260

Евгений Козлов пишет про IT

3 мая 2026 г., 07:12

Пока готовлю завершающие посты цикла по Concurrency мне попался https://blog.gaborkoos.com/posts/2025-08-26-Go-Channels-A-Runtime-Internals-Deep-Dive/ по Goшным каналам. Кажется что материалов тьма уже но именно эта статья на меня произвела сильное впечатление потому что в ней есть:

- Исторические предпосылки к создания примитива. Communicating Sequential Processes (CSP).
- Как устроена структура данных примитива. hchan. Как это выглядит с точки зрения памяти (memory layout).
- Структура sudog ("suspended goroutine"). Зачем нужна, какие проблемы решает, почему именно так.
- Пошаговые алгоритмы записи в канал / чтения из канала / закрытие канала.
- Функция select.
- Как работает копирование данных канала между горутинами.
- Связь каналов с моделью памяти. Синхронизация.
- Связь с планировщиком.

Обилие примеров для лучшего понимания сложных материй рантайма.

В общем, рекомендую. Подойдет как для подготовки к собесам так и для того чтобы лучше разобраться. Уверен, откроете для себя что-то новое.

1,520

Showing 10 of 10 posts

No more posts

Рейтинг

Требуется вход

Отзывы пользователей (0)

Пока нет отзывов. Будьте первым, кто поделится своим опытом!

Евгений Козлов пишет про IT

Евгений Козлов пишет про IT

Рейтинг

Рост участников (Последние 3 дней)

Последние посты

Рейтинг

Отзывы пользователей (0)

Похожие каналы Telegram

Albinasummer

PM работа. Проектные менеджеры

Русский Модный Код

Литературный коД

Компьютерная математика Weekly

AI Projects

ReLab Family

Книги по программированию

Похожие каналы Telegram

Albinasummer

PM работа. Проектные менеджеры

Русский Модный Код

Литературный коД

Компьютерная математика Weekly

AI Projects

ReLab Family

Книги по программированию

Отзывы пользователей (0)

Последние посты