Блог

Инженерия, ML и обновления продукта.

Prompt engineering в продакшне: 7 практик, которые реально работают

2026-04-02 · Дмитрий Соколов

Разбираем принципы, которые мы вынесли из двух лет обслуживания production-промптов для 200+ команд.

2026-03-20 · Мария Петрова

Шесть практических приёмов, которые принесли нам самую большую экономию: от prompt caching до routing по задачам.

2026-03-05 · Мария Петрова

Сравнили Claude 3 Sonnet и GPT-4 на 3 реальных classification задачах. Вот результаты по accuracy, latency и cost.

2026-02-18 · Алексей Волков

Реальная архитектура роутера, который выбирает модель под задачу и экономит нам 30% бюджета без деградации качества.

2026-01-28 · Дмитрий Соколов

Комбинация prompt caching и умного retrieval позволила нам срезать latency и стоимость RAG-пайплайна, не трогая индекс.

2025-12-15 · Елена Козлова

Опыт двух лет использования LLM в роли judge: где работает, где проваливается, как калибровать.

2025-11-05 · Алексей Волков

За 6 недель перевели половину production workload с GPT-4 на Claude. Несколько сюрпризов, которые стоит знать заранее.

2025-10-10 · Мария Петрова

Прогнали один и тот же трафик через 7 LLM-провайдеров. Разбег по стоимости — до 4.5x при сопоставимом качестве.