Feed aggregator

Momentum Attention: когда внимание получает инерцию

Habr.com - Mon, 10/27/2025 - 20:58

Внимание в трансформерах не имеет памяти между шагами, что ведет к нестабильным градиентам. Решение Momentum Attention, где текущие Value векторы смешиваются с предыдущими через экспоненциальное скользящее среднее. Этот подход добавляет инерцию, стабилизируя фокус модели. Внутри разбор механики, корректный код на PyTorch и анализ трейд оффов

Читать далее

Делаем свой ChatGPT за 10$ в месяц: разворачиваем LLM на облаке. Подробный гайд на VPS + API-обертка

Habr.com - Mon, 10/27/2025 - 20:31

Еще недавно поиск в Google или Яндекс был главным инструментом инженера. Сегодня все изменилось: AI-помощники вроде ChatGPT, Gemini или Claude, понимающие запросы на естественном языке, кардинально меняют подход к работе. Однако их использование упирается в серьезные преграды: вопросы конфиденциальности корпоративных данных, географические блокировки и лимиты бесплатных тарифов стали новой головной болью.

Что, если получить все преимущества мощной языковой модели, но без этих недостатков? Решение — развернуть собственную модель на своих серверах. Эта статья —практический гид по созданию автономного чат-бота, который не уходит в облако, работает без интернета и полностью защищает данные. Я пройду путь от теории до работающего локального прототипа.

Читать дальше

Как ускорить Windows 11 и сделать ее более оптимизированной

Habr.com - Mon, 10/27/2025 - 20:04

Windows 11 — современная и красивая операционка, но порой она может работать медленнее, чем хотелось бы. Особенно это заметно на старых или менее мощных ПК. Хорошая новость в том, что существует несколько простых и эффективных способов улучшить производительность системы, сделать её быстрее и удобнее в использовании.

В этой статье мы разберём, как правильно настроить Windows 11, избавиться от ненужных процессов и оптимизировать работу, чтобы ваш компьютер работал плавно и стабильно.

Кстати, если вам интересны IT-технологии и полезные инструменты, заглядывайте в мой Telegram-канал. Я регулярно публикую там свежие новости, лайфхаки и другие полезности. А сейчас — к сути статьи.

Читать далее

Создаём MCP‑сервер на практике

Habr.com - Mon, 10/27/2025 - 20:00

MCP без воды и шаблонного кода на практике: разбираем протокол, поднимаем сервер, тестируем через Inspector и учим LLM торговать через Finam API. Разберёмся, когда MCP выгоднее «обычных функций», как изолировать интеграции и упростить отладку инструментов.

Читать далее

Rust и приведение типов

Habr.com - Mon, 10/27/2025 - 19:50

Присматриваемся к Расту, как возможному кандидату на реализацию задачи Card DOM. Рассматриваем, как он поддерживает полиморфные структуры данных, в частности, приведение типов между трейтами.

Читать далее

Построение E2E-решения для прогнозирования временных рядов на примере метеоданных

Habr.com - Mon, 10/27/2025 - 19:44

Привет, Хабр!

Четыре года назад, еще в институте, одним из моих первых серьезных проектов была простая LSTM-модель для прогноза погоды. Недавно, пересматривая старые наработки, я задался вопросом: насколько дальше можно зайти, применив накопленный за эти годы опыт и современные инженерные практики?

Эта статья — история такого "рефакторинга длиною в 4 года". Это рассказ о том, как простой академический проект был переосмыслен и превращен в полноценное End-to-End (E2E) решение. Цель — не просто снова предсказать погоду, а на практическом примере продемонстрировать системный подход к построению ML-пайплайна с нуля.

В статье рассматриваются все ключевые этапы: от разработки отказоустойчивого веб-скрапера до проведения сравнительного анализа трех разнородных моделей прогнозирования:

Читать далее

Panther Lake: как Intel объединяет мощность и энергоэффективность в одном чипе

Habr.com - Mon, 10/27/2025 - 19:40

Производителям чипов приходится постоянно решать одну и ту же задачу — находить баланс между скоростью и энергоэффективностью. Intel, судя по последним анонсам, попыталась сделать это в серии Panther Lake. В ней компания собрала воедино успешные элементы предыдущих проектов. Так что Panther Lake становится своего рода мостом, соединяющим сегменты рынка, где раньше приходилось выбирать между экономией батареи и скоростью вычислений. И подходят чипы буквально для всего — от тонких ультрабуков до более требовательных систем. Что ж, поехали разбираться!

Читать далее

Как мы в Авито сделали свою LLM — A-vibe

Habr.com - Mon, 10/27/2025 - 19:17

Всем привет! Меня зовут Анастасия Рысьмятова, я руковожу юнитом LLM в Авито.
В этой статье я расскажу, как мы с командой создали и адаптировали нашу большую языковую модель A-vibe: зачем решили развивать собственную LLM, как построили токенизатор, собрали датасеты, провели SFT и RL и что получили в итоге. Поделюсь основными экспериментами и покажу наши результаты.

Читать далее

На моём производстве социализм, но все кредиты на меня, а сейчас мы в неоплачиваемом отпуске

Habr.com - Mon, 10/27/2025 - 19:00

Когда в России было мало своего производства и не было проблем с логистикой, почти всё заказывали ложементы за три копейки в Китае вместе с товарами. Сейчас ситуация изменилась. 

Цены у китайцев выросли, логистика подорожала и возить воздух в ложементах, как раньше, стало невыгодно. Китайцы стали браться только за огромные партии. Либо ценник в 10 раз выше. Теперь их редко удаётся прожать на: 

«Ребята, я буду брать миллионами, но сделайте мне сначала 100 на пробу». 

Поэтому, чтобы сэкономить на логистике, импортёры везут товары “навалом”, а товарные ложементы и коробки заказывают у нас в России.

При этом в России открывается всё больше производств.

Отсюда и появилась возможность заработать на ложементах.

Читать далее

Айсберг регистрации товарного знака: что упускает быстрый поиск и вскрывает полноценная проверка

Habr.com - Mon, 10/27/2025 - 18:46

Бесплатная проверка товарного знака за 5 минут не даёт полную картину. Когда (и как?) можно проверить самому и когда нужен специалист — чтобы не потерять бюджеты на 10 месяцев продвижения бренда и вынужденный ребрендинг.

Читать далее

Who's online

There are currently 0 users and 4 guests online.
Syndicate content