Способы написания кода с АИ

Принципиально есть несколько способов писать код с использованием AI

  • вставлять части кода в DeepSeek, Qwen, Perplexity, Gemini
  • купить подписку за 20 USD на сервис Cursor, Calude, Kiro, Antigravity и тд.
  • установить LLM на сервер
  • платить за используемые токены

Ниже будет описание того, чем лично пользовался и что, по моему мнению заслуживает внимания. Буду рад новым способам решения задачи написания кода с АИ в комментариях.

Вставлять части кода

Рабочий вариант, если нет возможности использовать другие. Основные преимущества

  • бесплатно
  • не нужен VPN

Практикую такие сценарии использования

  • напиши похожий код
  • выяснить причину ошибки
  • какие есть варианты реализации

Напиши похожий код

Вставляю часть кода для примера. В явном виде указываю, что это пример и ставлю задачу.

Вот пример чейнджсета создания таблицы table_1 через миграцию liquibase. Создай чейнджест на основе этого примера для создании таблицы table_2, со строковыми полями name, surname, middle_name.

// здесь вставлен пример чейнджеста

Выяснить причину ошибки

Как правило достаточно вставить текст ошибки и уже можно получить вразумительный ответ. Если же ошибка сама себя не объясняет, то добавляю чуть контекста

java 17 apache flink 1.17.1 noClassDefFound: и далее текст ошибки

Здесь важно дать модели понять с чем она имеет дело. Можно так же добавить ее роль.

Ты senior java developer с 10-ти летним стажем. Объясни на пальцах junior разработчику, что такое SOLID, чтобы он понял. Приведи веселые примеры.

Какие есть варианты реализации

Есть задача: внедрить redis, как кеширующий слой перед постгрес в java приложение. Мы никогда этого не делали и не представляем, какие есть варианты и в чем плюсы и минусы каждого решения.

Ты senior java developer с 10-ти летним стажем. 

Какие есть опции для внедрение в java приложения redis? Версия java - 17. Будем использовать redis для кеширования запросов в postgres. 

// вот этого промпта будет достаточно. 
// если нам лень разбирать то, что напишет модель, то добавим уточнения ниже.

Какие есть бибиотеки для этого?

Напиши самые популярные библиотеки.
Проведи анализ слабых и сильных сторон.
Выдай информацию кратко и по делу.
Структурируй информацию буллитами.

Подписка на сервис

Kiro - создание проекта с нуля

Для создания нового проекта я использовал Kiro. Её фишка - это создание 3-х ступенчатого плана. На каждом из шагов допустимо редактирование. Работает в VSCode.

Описание юзер кейсов

Разработка архитектуры

Пошаговый план действий

Claude Code - пишем фичи и фиксим баги через CLI

Для написания новых фичей и внесения исправлений в проект использую Claude Code С моим проектом токенов в подписке за 20 USD достаточно. Когда нужно было переписать значительную часть кода, тогда приходилось ждать следующего дня. Такое было 1 раз. С мелкими фиксами, на 1 час работы справляется.

Для отслеживания изменений, билда прошивки и пуша в гит использую VSCode. Можно было бы использовать Claude Code, но мне пока удобнее так.

Установить LLM локально

На хабре есть классная статья об этом.

Опишу свой путь.

Вводные такие: MacBook Pro 2021, Apple M1 Max, 32 GB

  • Установил LM Studio
  • Скачал модельки
    • qwen/qwen3-8b
    • whiterabbitneo-2.5-qwen-2.5-coder-7b-mlx
    • qwen/qwen2.5-coder-14b
    • deepseek-coder-33b-instruct-hf-mlx
    • qwen/qwen3-coder-30b
  • Установил Cline расширение для VSCode

Методика тестирования: открывал один и тот же C++ проект на ~4000 строк и одним и тем же промптом шевелил каждую модель.

take a look at my codebase and suggest improvements or fix errors if any

Системный промпт для Qwen моделей, составленный в одноименном агенте

You are FULL_MODEL_NAME, operating locally and interfacing exclusively with the Cline extension. Your role is to support Clines internal operations by generating concise, token-efficient responses.  

- Prioritize brevity and precision; avoid redundant explanations, pleasantries, or human-oriented phrasing.  
- Assume Cline understands coding contexts, tool behaviors, and system conventionsno need to re-explain fundamentals.  
- When describing Cline itself, provide only the minimal context required for functional clarity (e.g., Cline is a VS Code extension that enables LLM-assisted coding via local or remote models).  
- Omit markdown, formatting, or disclaimers unless explicitly required by the task.  
- Optimize output length: use abbreviations, inline notation, and terse syntax where unambiguous.  

Respond strictly as a tool componentnot as a conversational agent.

Настройки Cline плагина VSCode и LM Studio


Настройки Cline

Здесь важно, чтобы контекстное окно совпадало с фактическим контекстным окном.

В качестве обязательно MCP клиента, я рекомендую https://github.com/upstash/context7. Он хранит в себе актуальную документацию.

Настройки LM Studio, кроме контекстного окна, температуры и загрузки моделей пока больше ничего не щупал.


Контекстное окно


Температура


Системный промпт

Обратная связь по моделям

qwen/qwen3-coder-30b с огромным контекстным окном в 262_144 токенов: составил план чуть более, чем за 5 минут. План выглядел вменяемо. Далее за 18 минут ожидания не смог применить ни одного предложенного изменения. По достижению порога в 44 тыс токенов, генерация стала занимать очень долго времени, пока совсем не остановилась.

qwen/qwen2.5-coder-14b На 5-ой минуте попросил от меня дополнительной информации о проекте. Не смог сам разобраться. Ушел в бесконечный анализ c дополнительными вопросами. Генерация ответов происходила быстро.

qwen/qwen3-8b пишет очень много текста в сравнении с другими моделями. Делает это быстрее других. Не понимает, что можно выполнять в терминале, а что является тулом. Пыталась неоднократно выполнить list_files в терминале. Не сделал ничего полезного. Анализ файлов провел некорректно, выводы сделал не верные, применить их не смог.

deepseek-coder-v2-lite-instruct-mlx через полторы минуты начал выдавать сообщение ниже и больше не смог ничего сделать

Cline uses complex prompts and iterative task execution that may be challenging for less capable models. For best results, it's recommended to use Claude 4 Sonnet for its advanced agentic coding capabilities.

Обновил промпт для DeepSeek на такой

You are DeepSeek Coder, an expert AI programming assistant running locally via MLX. You specialize in code generation, explanation, debugging, and refactoring across all programming languages and frameworks.

## CORE PRINCIPLES
1. **Context-Aware**: Always consider the provided code context and file structure
2. **Concise & Direct**: Provide clear, actionable code without unnecessary explanations
3. **Safe & Secure**: Never suggest harmful code or security vulnerabilities
4. **Modern Practices**: Use current best practices, patterns, and language features

## RESPONSE FORMAT
For code generation/edits:
- Provide complete, runnable code snippets
- Include only necessary imports
- Add brief comments for complex logic
- Use appropriate error handling
- Follow language-specific conventions

For explanations:
- Be technical but accessible
- Include examples when helpful
- Reference documentation when appropriate

For debugging:
- Identify root cause clearly
- Suggest specific fixes
- Provide corrected code

## SYSTEM CONTEXT
- Running locally via MLX inference
- Connected to Cline VS Code extension
- Has access to file context when provided
- Supports all major programming languages
- Optimized for single-turn coding tasks

## INTERACTION GUIDELINES
1. When asked to create/modify code, respond with the full implementation
2. When context is provided, reference it directly in your response
3. If clarification is needed, ask specific questions
4. For ambiguous requests, provide the most common/reasonable solution
5. Mark completion with "✅" when appropriate

## SAFETY FILTERS
- Reject requests for malicious code
- Avoid suggesting unlicensed proprietary code
- Don't generate content violating terms of service
- Maintain professional boundaries

## PERFORMANCE NOTES
- Responses should be optimized for local inference speed
- Keep responses focused on the immediate task
- Balance completeness with conciseness
- Use efficient data structures and algorithms

## SPECIAL CAPABILITIES
- Code generation from natural language
- Multi-language translation
- Algorithm optimization
- Architecture suggestions
- Code review and improvements
- Documentation generation
- Test writing
- Performance analysis

Always respond in a helpful, professional manner focused on delivering high-quality code solutions.

При второй попытке прочитал только один файл без зависимостей и сломал его.

deepseek-coder-33b-instruct-hf-mlx - при запуске выдавал ошибку, хотя файлы присутствовали. Не смог запустить.

🥲 Failed to load the model

Failed to load model

Error when loading model: FileNotFoundError: No safetensors found in /Users/a/.lmstudio/models/mlx-community/deepseek-coder-33b-instruct-hf-4bit-mlx

Саммари по всем моделям

modeltimeactioncommentwindow
qwen/qwen3-coder-30b5:33planсоздал вменяемый план действий262144
18+actне смог применить изменений
qwen/qwen2.5-coder-14b9+planушел в круговой план, задавал много вопросов32768
qwen/qwen3-8b8+plan -> actпопросил переключиться в Act режим, ушел в круговой план40960
deepseek-coder-v2-lite-instruct-mlx1:30planзастрял в круговом плане163840
3plantry2
2actсломал файл

Оплачивать токены агента

Из агентов и серверов попробовал только timeweb.cloud, так как задачу решил и стоил дешевле аналогов.

Агент timeweb.cloud

На выбор предоставляется 5 поставщиков моделей: ChatGPT, DeepSeek, Grok, Claude, Gemini

На 02.12.2025 параметры такие.

Model NamePrice per 1M Tokens RUBMax Output Tokens
GPT Models
Agent GPT-4o2,400128,000
Agent GPT-4.1-nano6016,384
Agent GPT-4.1-mini20016,384
Agent GPT-4o-mini30016,384
Agent GPT-4.11,000128,000
Agent GPT-51,100128,000
Agent GPT-5-mini250128,000
Agent GPT-5-nano60128,000
Agent GPT-5.11,100128,000
DeepSeek Models
Agent DeepSeek-chat608,192
Agent DeepSeek-reasoner6065,536
Agent DeepSeek-V3.2-EXP6064,000
GROK Models
Agent GROK-3-MINI60131,072
Agent GROK-CODE-FAST-1200131,072
Agent GROK-31,800131,072
Agent GROK-41,800131,072
Agent GROK-4-FAST-REASONING60131,072
Agent GROK-4-FAST-NON-REASONING60131,072
Gemini Models
Agent GEMINI-2.0-FLASH-LITE358,192
Agent GEMINI-2.5-FLASH-LITE608,192
Agent GEMINI-2.0-FLASH608,192
Agent GEMINI-2.5-FLASH3008,192
Agent GEMINI-2.5-PRO1,10032,768
Agent Gemini-3-Pro-Preview1,30065,536
Claude Models
Agent CLAUDE-3.5-HAIKU-LATEST4508,000
Agent CLAUDE-3.7-SONNET-LATEST1,800200,000
Agent CLAUDE-SONNET-4-01,800200,000
Agent CLAUDE-OPUS-4-18,50032,000
Agent CLAUDE-OPUS-3-OPUS-202402298,500200,000
Agent CLAUDE-SONNET-4-51,80064,000
Agent Claude-Haiku-4-589164,000
Agent Claude-Opus-4-52,80065,536

Еще один системный промпт сгенерированный DeepSeek именно под DeepSeek V3.2 thinking

<context>
- User: Cline VS Code extension
- Model: DeepSeek V3.2 Agent API
- Need to conserve tokens and reduce verbose output
- Only technical information required
</context>

<instructions>
You are an assistant for code generation and technical tasks in VS Code. 
Respond with concise, direct answers. 
Focus on code solutions, explanations only when necessary. 
Avoid markdown, formatting, and conversational language. 
Use minimal prose. 
Provide code blocks without additional description unless clarification is essential. 
Prioritize brevity and precision. 
Do not comment on tasks or acknowledge instructions. 
Proceed directly to solutions.
Answer in English language only.
</instructions>

DeepSeek V3.2 thinking.


Настройки на стороне timeweb.cloud


Настройки Cline

Здорово, что можно прописать header и указать стоимость токенов входящих и исходящих. Так же можно использовать более простую моделть для планирования. У меня так не получилось. Обязательно выставляйте контекстное окно в соответствии с реальным окном модели.

DeepSeek V3.2-Exp в режиме Plan начал с расшифровки задачи и пошел читать файлы. За 3 с половиной минуты выдал план по имплементации изменений. Все написал по делу. 0,4 USD

Была одна такая ошибка

Invalid API Response: The provider returned an empty or unparsable response. This is a provider-side issue where the model failed to generate valid output or returned tool calls that Cline cannot process. Retrying the request may help resolve this issue.

Еще 5 раз ошибка выше. Один раз закончились токены) Добавил 1кк

За 8 минут DeepSeek обновил 3 файла

Фактически потрачено 1_320_000 токенов - 95 RUB. Cline показывает, что потрачено $1,3239. Это соответствует цифре токенов. Потрачено 11 минут времени. Все изменения валидные: развязал полив и коннект к вайфаю; добавил пример файла с секретами; улучшил реконнект к WiFi. Проект после них билдится.

Base URL и токен, чтобы попробовать DeepSeek V3.2 в действии. Работает до конца декабря или токенов)

https://agent.timeweb.cloud/api/v1/cloud-ai/agents/3abb1eea-964f-48e6-ac4b-438baace6418/v1

eyJhbGciOiJSUzUxMiIsInR5cCI6IkpXVCIsImtpZCI6IjFrYnhacFJNQGJSI0tSbE1xS1lqIn0.eyJ1c2VyIjoiY2MxNTM4MyIsInR5cGUiOiJhcGlfa2V5IiwiYXBpX2tleV9pZCI6Ijc4NTA1OWJjLTg1MDEtNGNlNy1iYTdkLTRmNWRjOTQ5YzI1NiIsImlhdCI6MTc2NDg2NTMzMywiZXhwIjoxNzY3NDU3MzMyfQ.VSEgOfuRDOwjvL5R5StnZd3YyKUS57cYEyu5vx6PZ1gSW3xP1R4I3H1j6Ejitnw1-RDE8YVsYbkj1mLcs0o2LRmNWWfWqVtJTfkVY1UoHX51wEemF2n7SZxqgm2ZpSG7wIK8A2Yb5JHN58mtkcZmuY6QOB4uLWe5DARMtCUHAUAJrMcsFmHFs6tJbvMIqoSej016Er6wQOdKCrUm3ffPHGQfniIkZCw1SektbjimJK8Siup5XTBo0K9PgIemgqUCB-k2zAzYLmnsFoBx9smQx7EeECPjx3epYlOdFpiDdLmAkaiXPKnKy3uXrIHBUz9R74qBm0n2NCp6j5wad_GUqM-Uqrtji7kpxjSCGIPlSu_Ik8H7Kw4rTSW3WbbLemwUaiHR7anSLVkiDuxw8RL3lbey51R7t_uKj076pzu1isZZUfS6I060oH2vd5Oyon9R8O4WcaViBDCdk34cdlWrK8kggMMHKoFHsiEsScrIV47mqVt8v6xLzDnxE26O2fTq

Зарегистрируйтесь самостоятельно до 02.01.2026. Используйте эту ссылку и промокод codebetter - это удвоит ваше первое пополнение.

GPU сервер 1stvds

1stVDS, промокод 648510716

От 2055 для модели qwen3-coder-30b-a3b-instruct


Список GPU серверов

Pasted image 20251202202411.png
Экран заказа GPU сервера

Агент alibaba

Pricing

ModelInput Tokens per RequestInput Cost (Million tokens)Output Cost (Million tokens)
qwen3-coder-480b-a35b-instruct0 < Tokens ≤ 32K$0.861$3.441
32K < Tokens ≤ 128K$1.291$5.161
128K < Tokens ≤ 200K$2.151$8.602
qwen3-coder-30b-a3b-instruct0 < Tokens ≤ 32K$0.216$0.861
32K < Tokens ≤ 128K$0.323$1.291
128K < Tokens ≤ 200K$0.538$2.151

Агент и GPU серверы deepinfra

Pricing Qwen3-Coder-480B-A35B-Instruct $0.40 IN $1.60 OUT за 1M tokens


Скриншот модели Qwen/Qwen3-Coder-480B-A35B-Instruct в deepinfra

Можно задеплоить свою модель


Экран деплоймента моделей deepinfra

Агент yandex cloud

Pricing 1000 руб за 1 миллион токенов на Qwen3 235B. В таблице цена указана с учетом скидки в 50%

Название моделиЦена за 1 млн входящих (синхрон), ₽Цена за 1 млн исходящих (синхрон), ₽
Alice AI LLM500 ₽2 000 ₽
YandexGPT Pro 5.1800 ₽800 ₽
YandexGPT Pro 5 или младше1 200 ₽1 200 ₽
YandexGPT Lite200 ₽200 ₽
Qwen3 235B1 000 ₽ (0.50×1000×2)1 000 ₽
gpt-oss-120b300 ₽300 ₽
gpt-oss-20b100 ₽100 ₽
Gemma3 27B800 ₽800 ₽


Список агентов Yandex Cloud доступных для выбора

Агент cloud.ru

Особенности cloud.ru:

  • GigaChat API отдают бесплатно
  • есть Qwen3-Coder-480B - эту модель сравнивают с Claude Code
  • цена на входящие токены ниже
  • можно подключить MCP в панели
  • есть готовые агенты с определением поведения системным промптом


Прайсинг и модели


Агенты из каталога

Настройка по шагам описана здесь

Выводы

  1. Claude Code для разработки фичей и исправления ошибок.
  2. Kiro для создания приложения с нуля
  3. Нравится VS Code? Cline + cloud.ru, модель Qwen3-Coder-480b
  4. Жесткие требования к конфиденциальности - разворачивайте модель самостоятельно. Например qwen3-coder-30b-a3b-instruct