[ b / news / + ]
Главная Юзердоски Каталог Трекер NSFW Настройки

Искусственный интеллект

Создать тред Создать тред
Check this out!

Генерация откровенного NSFW-контента на доске /nf/

<<
Каталог
Вопросов кожаных мешков тред Аноним 14/05/23 Вск 11:27:57 299474 Ответ
fde636c44dae155[...].jpg 294Кб, 1000x600
1000x600
Если вы хотите задать какой-то мелкий вопрос - используйте для этого данный тред или найдите профильный треде в каталоге.

Утонувшие треды помещаются в архив.
О разделе:
1. Доска предназначена для любых обсуждений нейросетей, их перспектив и результатов.
2. AICG тред перекатывается после достижения предела в 1500 постов.
3. Срачи рукотворное vs. ИИ не приветствуются. Особо впечатлительные художники и им сочувствующие катятся в собственный раздел => /pa/. Генераций и срачей в контексте всем известных политических событий это тоже касается, для них есть соответствующие разделы.
4. Это раздел преимущественно технического направления. Для откровенного NSFW-контента выделена отдельная доска - /nf/, эротика остаётся в /ai/. Так, порнография и голые мужики теперь отправляются в /nf/. Фурри - в /fur/. Гуро и копро - в /ho/.
Пропущено 250 постов
250 с картинками.
Пропущено 1497 постов, 250 с картинками.
Аноним 17/04/25 Чтв 17:25:08 1159908
>>1159873
>обсуждать политику без хуйни
Ага, чтобы получить не просто отказ говорить на опасную тему а сразу бутылку от товарища майора.
Аноним 17/04/25 Чтв 17:34:12 1159919
>>1159908
Он вообще-то с радостью поддерживает такие разговоры.
Аноним 17/04/25 Чтв 18:18:37 1159994
Аноны, хочу обучить свою голосовую модель 30%моего войса и70% другого. Скажите, в итоге будет ли максимально натуральным и естественным преобразование?
Новости об искусственном интеллекте №11 /news/ Аноним 13/04/25 Вск 20:26:31 1150670 Ответ
c5f072e5-ec19-4[...].jpg 177Кб, 700x466
700x466
777877878787877[...].mp4 7292Кб, 832x1160, 00:01:18
832x1160
В этот тредик скидываются свежие новости по теме ИИ! Залетай и будь в курсе самых последних событий и достижений в этой области!

Прошлые треды: https://arhivach.hk/?tags=16252
Пропущено 42 постов
42 с картинками.
Пропущено 150 постов, 42 с картинками.
Аноним 17/04/25 Чтв 18:46:48 1160040
>>1159982
> посмотреть результат? Ввести что-то?
С внешними костылями инструментами может. Из коробки компьютер юз только у клода есть.
Аноним 17/04/25 Чтв 18:47:43 1160042
>>1160024
Ну все, проект человечество уже можно закрывать.
Аноним 17/04/25 Чтв 19:15:10 1160074
image.png 2Кб, 50x42
50x42
>>1160024
Калькулятор лучше меня считает, и что? У него айкью выше?
Локальные языковые модели (LLM): LLaMA, Gemma, DeepSeek и прочие №123 /llama/ Аноним 17/04/25 Чтв 17:13:21 1159889 Ответ
Llama 1.png 818Кб, 630x900
630x900
Альфа от контек[...].png 121Кб, 3090x1830
3090x1830
KL-divergence s[...].jpg 223Кб, 1771x944
1771x944
17447508048920.mp4 8483Кб, 1280x720, 00:00:06
1280x720
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст, бугуртим с кривейшего тормозного говна и обоссываем калотарок.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.gitgud.site/wiki/llama/

Инструменты для запуска на десктопах:
• Самый простой в использовании и установке форк llamacpp, позволяющий гонять GGML и GGUF форматы: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Однокнопочные инструменты с ограниченными возможностями для настройки: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
Актуальный Не совсем актуальный список моделей с отзывами от тредовичков на конец 2024-го: https://rentry.co/llm-models
• Неактуальный список моделей по состоянию на середину 2023-го: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Aleteian и https://huggingface.co/Moraliane
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по чуть менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Пресеты под локальный ролплей в различных форматах: https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/

Архив тредов можно найти на архиваче: https://arhivach.hk/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1149538 (OP)
>>1142778 (OP)
Пропущено 4 постов
4 с картинками.
Пропущено 27 постов, 4 с картинками.
Аноним 17/04/25 Чтв 19:08:39 1160064
>>1160060
> невозможность установить самые базовые и банальные вещи в один клик без коммандной консоли

Да, написать sudo apt install хуйнянейм1 хуйнянейм2 хуйнянейм3
гораздо тяжелее чем:
- найти сайт без троянов
- скачать троян
- скачать майнер
- скачать кряк под это все под vpnом
- запустить .msi пакет и сказать ДА
- выбрать папочку
- выбрать попочку
- разрешить добавить пункт в проводник
- отказаться от спама
- почитать лицензионное (нет)
- молиться что не проебал снятие галочки "установить ябраузер, тащмайора и пикабу"
- подождать, перезагрузится
- повторить
Аноним 17/04/25 Чтв 19:11:10 1160066
>>1160038
>Крч анон если хочешь использовать линукс - убунту с родным гномом.
А что это за Proxmox, который куча обзорщиков нейронок ставит? Стоит этим заморачиваться?
Аноним 17/04/25 Чтв 19:15:00 1160073
>>1160064
Хз че ты там такое скачиваешь, раз с такими проблемами сталкиваешься, лично у меня подобной хуйни не было. Да и может перед скачиванием чего либо стоило предварительно всплыть из нижнего интернета?
Музыкальный общий №10 /music/ Аноним 31/03/25 Пнд 22:42:42 1123903 Ответ
Where The Dark [...].mp4 5922Кб, 720x720, 00:03:29
720x720
Не ангелы.mp4 6850Кб, 1282x720, 00:03:09
1282x720
Алеся.mp4 4169Кб, 720x720, 00:03:04
720x720
Ходишь и ссышь.mp4 2168Кб, 360x640, 00:01:54
360x640
♫ Udio ♫
https://www.udio.com/

Вышла версия 1.5 Allegro, по функционалу то же, что и 1.5, только в два раза быстрее. Лимит 400 кредитов в месяц (или 200 генераций по 33 секунды каждая) при условии ежедневного захода на сайт - 100 кредитов даются в месяц, и еще 10 кредитов даются ежедневно. Также можно фармить кредиты, выполняя специальные задания по оцениванию качества рандомных треков, это дает не больше 10 дополнительных кредитов в день. Для большего числа кредитов и более продвинутых фич типа инпэйнтинга или генерации с загруженного аудио нужно платить. Появилась возможность генерировать треки по 2 минуты 11 секунд, не больше 3 длинных треков (по 2 версии на каждый трек) в день на бесплатном тарифе.

♫ Suno ♫
https://app.suno.ai/ генерация на сайте
https://suno.ai/discord генерация на официальном discord-сервере
https://rentry.co/suno_tips советы по использованию

Лимиты: 10 генераций в день. Нужна платная подписка чтобы увеличить лимиты, либо можно абузить сервис через создание множества аккаунтов

♫ Riffusion ♫
https://www.riffusion.com/

Новинка, по качеству звука на уровне Суно или чуть выше. Пока БЕСПЛАТЕН и безлимитен, но халява скоро закончится. Может в русский, среднее понимание промпта, стили очень общие. Плюс в том, что скорость генерации очень высокая.

https://www.riffusion.com/docs

Инструкция по применению, тегам и прочему на английском.

Локальные модели:

Китайский YuE

https://github.com/multimodal-art-projection/YuE

Это буквально первый проект который может генерировать песни по заданному тексту локально. Оригинальная версия генерирует 30-секундный отрывок за 5 минут на 4090. На данный момент качество музыки низкое по сравнению с Суно.

Еще сайты по генерации ИИ-музыки, в них тоже низкое качество звука и понимание промпта по сравнению с Суно, либо какие-то другие недостатки типа слишком долгого ожидания генерации или скудного набора жанров, но может кому-то зайдет, поэтому без описания:

https://sonauto.ai/
https://www.beatoven.ai/
https://stableaudio.com/
https://www.loudly.com/music/ai-music-generator

______________

Напомню мега-сайт для сочинения аутентичных англоязычных текстов для ИИ-музыки в стиле известных групп и артистов от Пинк Флойда до Эминема. Зайти можно только через Дискорд.

https://codyai.cc/

Прошлый тред

>>1042037 (OP)
Пропущено 135 постов
135 с картинками.
Пропущено 263 постов, 135 с картинками.
Аноним 17/04/25 Чтв 14:55:23 1159635
Аноним 17/04/25 Чтв 17:02:59 1159881
TRAP.mp4 5481Кб, 720x864, 00:03:44
720x864
>>1123903 (OP)
Для тех у кого микролабы или побольше...
Аноним 17/04/25 Чтв 19:14:06 1160072
Endless Wander.mp4 10615Кб, 1280x960, 00:03:51
1280x960
AI Chatbot General № 664 /aicg/ Аноним 17/04/25 Чтв 16:30:32 1159814 Ответ
17426507800610.png 605Кб, 1024x768
1024x768
17448943768610.png 448Кб, 809x630
809x630
17448948916110.png 118Кб, 1041x391
1041x391
AI Chatbot General № 664

БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!!

Общий вопросов по чат-ботам и прочего тред.

Новости
• Вышли модели GPT-4.1 - https://openai.com/index/gpt-4-1/
• Grok 3 появился на API - https://docs.x.ai/docs/models#models-and-pricing
• Апдейт chatgpt-4o-latest - https://help.openai.com/en/articles/6825453-chatgpt-release-notes

Большие фронтенды
• SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна)
• Гайды на таверну: https://rentry.co/Tavern4Retards | https://rentry.org/STAI-Termux (на андроид)
• Agnai: https://agnai.chat/
• Risu: https://risuai.xyz/

Малые фронтенды
• Adventure-UI: https://rentry.co/CYOA_AdventureUI
• Cavern: https://github.com/Barbariskaa/Cavern

Модели
• Claude: https://docs.anthropic.com/en/docs
• GPT: https://platform.openai.com/docs
• Gemini: https://ai.google.dev/gemini-api/docs
• Grok: https://docs.x.ai/docs
• DeepSeek: https://api-docs.deepseek.com/

Пресеты
• Бургерский список: https://rentry.org/jb-listing
• Тредовский список: https://rentry.org/2ch-aicg-jb

Полезности
• Тредовский список: https://rentry.org/2ch-aicg-utils

Ботоводчество
• Чуб: https://characterhub.org | https://chub.ai/characters
• Гайды: https://rentry.org/meta_botmaking_list
• Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3
• Бургерские боты: https://rentry.org/meta_bot_list

Прочее
• Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/
• База по Клоду: https://rentry.org/how2claude
• Чекер ключей: https://github.com/kingbased/keychecker
• Чай: https://character.ai/

Мета
• Архив тредов: https://rentry.org/2ch-aicg-archives3
• Тредовые ивенты: https://rentry.org/2chaicgthemedevents
• Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2
• Локальные языковые модели: >>1149538 (OP)
• Шаблон шапки: https://rentry.org/shapka_aicg

Прошлый тред: >>1157826 (OP)
Пропущено 35 постов
35 с картинками.
Пропущено 159 постов, 35 с картинками.
Аноним 17/04/25 Чтв 19:12:23 1160069
Реален ли моммидом с колумбийскими шмелями?
Аноним 17/04/25 Чтв 19:13:07 1160070
17343361164020.mp4 1110Кб, 1280x720, 00:00:10
1280x720
>поззед ключи гемени
Аноним 17/04/25 Чтв 19:13:11 1160071
>>1160069
моми не может иметь волосатый хуй с яйцами
Stable Diffusion тред X+153 /sd/ Аноним 11/04/25 Птн 11:27:03 1145307 Ответ
image.png 2720Кб, 1024x1536
1024x1536
image.png 2677Кб, 1024x1024
1024x1024
image.png 5095Кб, 1360x1440
1360x1440
image.png 2335Кб, 832x1216
832x1216
Тред локальной генерации, преимущественно реализм.
Cоседи
► Аниме-тред >>1144753 (OP) ► Техно-тред >>1118663 (OP)

База:
→ Приложение ComfyUI https://www.comfy.org/download
→ Примеры https://comfyanonymous.github.io/ComfyUI_examples/ (откуда, куда, как. Начинать со страницы SDXL)
→ Менеджер расширений https://github.com/ltdrdata/ComfyUI-Manager (автоустановка, реестр расширений)
→ Модели https://civitai.com/ (собрано со всего инета)

Промт должен быть кратким для SDXL и поэма длинная для Flux и SD3.5, негативы обычно вредны.

ЧТО НОВОГО АКТУАЛЬНОГО ЗА ГОД
• SDXL модели: Natvis Natural Vision v1.0, BigASP v1.0, Illustious (cyberillustrious/thrillustrious), NoobAI (noobReal). Все 4 NSFW;
• SD3.5 medium и large;
• Flux dev и schnell;
• Auraflow. Станет Pony Diffusion v7;
• ComfyUI + Krita = Krita-ai-diffusion;
• DARE Merge;
• Лора DMD2 для SDXL ускоряет в 2 раза. Пример: 10 шагов, семплер LCM, шедулер beta, 832x1216,
CFG 1-1.2 для обычных SDXL https://huggingface.co/tianweiy/DMD2/blob/main/dmd2_sdxl_4step_lora_fp16.safetensors,
CFG 3 для NoobAI https://huggingface.co/YOB-AI/DMD2MOD/blob/main/LYC-DMD2MOD%20(Dmo%2BTffnoi).safetensors,

Оффлайн модели для картинок: Stable Diffusion, Flux, OmniGen (Shitao), Auraflow, HunyuanDiT, Lumina, Kolors, Deepseek Janus-Pro, Sana
Оффлайн модели для анимаций: HunyuanVideo, Lightrics (LTXV), Wan-Video, Mochi, Nvidia Cosmos, PyramidFlow, CogVideo, AnimationDIFF, Stable Video Diffusion
Приложения: ComfyUI, Fooocus, webui-reForge, Stability matrix, webui-Forge (мёртв), webui от A1111 (мёртв)

► Предыдущий тред >>1127030 (OP)https://arhivach.hk/?tags=13840
Дополнительно: https://telegra.ph/Stable-Diffusion-tred-X-01-03
Пропущено 150 постов
150 с картинками.
Пропущено 366 постов, 150 с картинками.
Аноним 17/04/25 Чтв 17:59:47 1159972
2024-12-2302-32[...].png 1309Кб, 896x1088
896x1088
2024-12-2301-42[...].png 1268Кб, 960x1024
960x1024
2024-12-2301-46[...].png 1170Кб, 960x1024
960x1024
2024-12-2302-45[...].png 1190Кб, 960x1024
960x1024
Аноним 17/04/25 Чтв 18:31:18 1160014
image 4078Кб, 1872x2736
1872x2736
image 4302Кб, 1872x2736
1872x2736
image 4248Кб, 1872x2736
1872x2736
image 4398Кб, 1872x2736
1872x2736
Аноним 17/04/25 Чтв 18:39:40 1160026
ComfyUItempjgvi[...].png 4023Кб, 1280x1360
1280x1360
ComfyUItempjgvi[...].png 3852Кб, 1280x1360
1280x1360
ComfyUItempjgvi[...].png 3876Кб, 1280x1360
1280x1360
ComfyUItempjgvi[...].png 3959Кб, 1280x1360
1280x1360
ИИ-видео общий №6 /video/ Аноним 29/03/25 Суб 23:23:20 1120067 Ответ
17415188875670.mp4 985Кб, 1280x720, 00:00:06
1280x720
17419540385170.mp4 2473Кб, 1280x720, 00:00:05
1280x720
I wanted to see[...].mp4 6837Кб, 1280x720, 00:00:36
1280x720
17397909184564.mp4 6046Кб, 960x540, 00:00:08
960x540
Генерируем свое (и постим чужое) в Hunyuan, Wan, Luma Dream Machine, Hailuo Minimax, Kling, Sora, Vidu, Runway, Pixverse, Pika и др. сервисах.


1. Hailuo Minimax

https://hailuoai.video/

2. Kling

https://klingai.com/

3. Sora от OpenAi

https://openai.com/sora/

4. Luma Dream Machine

https://lumalabs.ai/

5. Vidu

https://www.vidu.com/create

6. Pixverse

https://app.pixverse.ai/

7. Pika

https://pika.art/try

8. Runway Gen. 3

https://runwayml.com/

9. Wan от Alibaba

https://wan.video/


Сайты, где можно попробовать генерации на разных моделях

https://pollo.ai/
https://www.florafauna.ai/
https://nim.video/

Коллекция ИИ-видео:

https://www.reddit.com/r/aivideo/

Локальные модели

1. Hunyuan от Tencent.

https://hunyuanvideoai.com/
https://github.com/Tencent/HunyuanVideo

2. Wan от Alibaba

https://github.com/Wan-Video/Wan2.1

Локальный UI
https://github.com/comfyanonymous/ComfyUI

Установка локальных моделей
Hunyuan Video: https://comfyanonymous.github.io/ComfyUI_examples/hunyuan_video/
Wan 2.1: https://comfyanonymous.github.io/ComfyUI_examples/wan/

Альтернативные ноды ComfyUI
Hunyuan Video: https://github.com/kijai/ComfyUI-HunyuanVideoWrapper
Wan 2.1: https://github.com/kijai/ComfyUI-WanVideoWrapper

Квантованные чекпоинты

Hunyuan Video (GGUF): https://huggingface.co/Kijai/SkyReels-V1-Hunyuan_comfy/tree/main
Wan 2.1 (GGUF): https://huggingface.co/city96/Wan2.1-I2V-14B-480P-gguf/tree/main
Wan 2.1 (NF4): https://civitai.com/models/1299436?modelVersionId=1466629

Где брать готовые LoRA
https://civitai.com/models
Hunyuan Video: https://civitai.com/search/models?baseModel=Hunyuan%20Video&sortBy=models_v9
Wan 2.1: https://civitai.com/search/models?baseModel=Wan%20Video&sortBy=models_v9

Обучение LoRA
https://github.com/tdrussell/diffusion-pipe

Предыдущий тред

>>1082918 (OP)
Пропущено 79 постов
79 с картинками.
Пропущено 235 постов, 79 с картинками.
Аноним 16/04/25 Срд 23:02:35 1158463
>>1158434
Спасибо, более менее похоже, хоть и объекты на переднем плане трясет, поиграюсь.
Аноним 17/04/25 Чтв 17:57:59 1159967
Аноним 17/04/25 Чтв 18:35:02 1160022
1744904015420.mp4 18054Кб, 608x640, 00:00:04
608x640
1744904015422.mp4 17298Кб, 608x640, 00:00:04
608x640
Потестил FramePack. Ну хз, кал какой-то. Не сказать что быстрее прям, без тикэша 5 минут
Anime Diffusion #205 /nai/ Аноним 14/04/25 Пнд 20:11:42 1152597 Ответ
1619135453170.png 22491Кб, 4464x4464
4464x4464
1646165123897.jpg 2674Кб, 2248x3000
2248x3000
1658206293055.jpg 990Кб, 1536x1920
1536x1920
1680018419889.jpg 1045Кб, 1024x1536
1024x1536
1652378023991.png 2651Кб, 1920x1080
1920x1080
1669799562234.jpg 2085Кб, 1368x1920
1368x1920
1733824320876.png 3270Кб, 1440x2016
1440x2016
1599750468675.png 3601Кб, 1536x2048
1536x2048
Генерируем тяночек!

Прошлый тред: >>1144753 (OP) https://arhivach.hk/thread/1161625/

Схожие тематические треды
• SD-тред (не аниме): >>1145307 (OP)
• Технотред: >>1118663 (OP)
• Фурри-тред: https://2ch.hk/fur/res/374311.html

FAQ
https://2ch-ai.gitgud.site/wiki/nai

Установка
• NVidia: https://rentry.co/2ch_nai_guide
• AMD: https://2ch-ai.gitgud.site/wiki/nai/install/amd
• Облака: https://2ch-ai.gitgud.site/wiki/nai/install/clouds

Дополнительная информация
• Интерфейсы: https://2ch-ai.gitgud.site/wiki/nai/interfaces
• Модели: https://2ch-ai.gitgud.site/wiki/nai/models
• Промпты: https://2ch-ai.gitgud.site/wiki/nai/prompts
• Апскейл: https://2ch-ai.gitgud.site/wiki/nai/upscale
• LoRA: https://2ch-ai.gitgud.site/wiki/nai/lora
• ControlNet: https://2ch-ai.gitgud.site/wiki/nai/controlnet

Прочее
• CivitAI: https://civitai.com
• Каталог ссылок от форчанеров: https://rentry.co/sdg-link
• Шаблон для переката: https://rentry.co/nwhci
Пропущено 85 постов
85 с картинками.
Пропущено 258 постов, 85 с картинками.
Аноним 17/04/25 Чтв 17:26:03 1159911
6EHS582ZEH6C6NJ[...].jpg 638Кб, 2304x2304
2304x2304
Аноним 17/04/25 Чтв 18:15:18 1159988
alpha.png 4Кб, 1024x1024
1024x1024
image.png 81Кб, 905x300
905x300
image.png 8Кб, 252x30
252x30
Аноним 17/04/25 Чтв 18:21:31 1159997
image.png 49Кб, 244x160
244x160
image.png 37Кб, 394x118
394x118
image.png 29Кб, 504x137
504x137
Я студентка матфакультета, специализируюсь на прикладной математике и работаю в data science. В посл Аноним # OP 16/04/25 Срд 16:16:03 1157439 Ответ
assetstask01jr5[...].png 2966Кб, 1536x1024
1536x1024
Я студентка матфакультета, специализируюсь на прикладной математике и работаю в data science. В последние пару лет плотно занимаюсь генеративными моделями, в основном LLM и diffusion-системами. Проекты есть, практика есть, опыт растёт. Но сейчас пришёл момент, когда хочется определить более устойчивое направление для серьёзных исследований.

Хайп вокруг генеративок не утихает, но архитектуры генеративных моделей имеют пока что не исправимые недостатки. Поэтому я начала смотреть в сторону менее популярных, но, возможно, более значимых в будущем направлений.

Как думаете какие виды искуственного интеллекта смогут заменить превычные нам за эти 4 года трансформеро зависимые llm?
Пропущено 3 постов
3 с картинками.
Пропущено 2 постов, 3 с картинками.
Аноним 17/04/25 Чтв 04:40:45 1158914
photo2025-02-28[...].jpg 126Кб, 1178x1137
1178x1137
>>1157439 (OP)
> в сторону менее популярных, но, возможно, более значимых в будущем направлений.

Это конечно перспективно, но мы пока что ещё трансформеры только копнули. Сегка. DeepSeek конечно обучил свою модель не в 40 раз эфективнее чем OpenAI (или сколько там журналисты придумали), но раза в 2 точно, а может и больше. Опять же CoT и прочие, казалось бы тривиальные вещи, которые улучшают качество работы трансформеров очень и очень существенно.

Я пишу это к тому что трансформеры сейчас являются наверное ну самой перспективной поляной для исследований: есть куда копать (регулярные скачки качества моделей это демонстрирут), есть интерес со стороны бизнеса (самоочевидно), тема на слуху (также самоочевидно). Вот пройдёт время, GPT-14 будет отличаться от GPT-15 примерно как iPhone 14 от iPhone 15 (почти никак) тогда уже можно думать о чём то другом, а пока за эту волну хайпа надо держаться как за спасательный круг.
Аноним 17/04/25 Чтв 15:11:09 1159674
image 529Кб, 1560x1456
1560x1456
Аноним 17/04/25 Чтв 17:00:12 1159878
>>1157439 (OP)
Пошла нахуй с доски. Мы тут общаемся с вайфу и генерим прон. Ты нахуй тут не нужна, уебище
На сайте в krea.ai была возможность менять лица на фотографиях, делал он это очень быстро и довольно Аноним 16/04/25 Срд 23:16:53 1158504 Ответ
174483376096165[...].jpg 25Кб, 800x800
800x800
На сайте в krea.ai была возможность менять лица на фотографиях, делал он это очень быстро и довольно качественно
Теперь эту функцию убрали
Или хуй пойми куда убрали? Я не шарю
Где мне найти эту хуйню? На хуй ее сносить? Аналоги мне не нравятся
Или подскажите более лучший аналог этой шляпы
Меняю лица с порнух на свою яой и дрочу на эту хуйню как конь ебаный на хуй у сука блять, где мне найти такое же?
Пропущено 1 постов
1 с картинками.
Пропущено 6 постов, 1 с картинками.
Аноним 17/04/25 Чтв 08:44:12 1158998
>>1158996
Studio Canvas
Бля ну как ее так спокойно снесли? Может хоть продали тип и теперь этот раздел пренадлежит кому другому? Я хуй знает как это все работает, но как можно взять и снести ахуенную хуйню
Аноним 17/04/25 Чтв 09:19:01 1159039
>>1158998
Очень просто на самом деле. Можно вспомнить ещё возможность генерировать голых баб в этой нейросетке, пусть и посредственных. Ну это походу был начальный тест-период, когда надо было народ завлечь. Потом лавочку прикрыли. А так помимо Krea, ещё убрали и в приложении Faceapp бесплатную функцию замены лица. Так что это тенденция устойчивая.

Я ещё пользуюсь Clipdrop, но чисто чтобы лишний объект удалить там, где Фотошоп не очень справляется. Ах, да, там было раньше функционала больше, бесплатно можно было расширять изображение.

Есть ещё Kling, там можно работать и с изображениями, генерируя их и при этом сохраняя лицо человека от исходного приложения.
Аноним 17/04/25 Чтв 16:51:34 1159865
Бамп
Stable Diffusion технотред #19 /tech/ Аноним 29/03/25 Суб 07:54:20 1118663 Ответ
training methods.png 1034Кб, 3510x2910
3510x2910
diffusion proce[...].png 358Кб, 2546x1822
2546x1822
lr.png 252Кб, 1853x624
1853x624
performance cha[...].png 454Кб, 2440x934
2440x934
flux arch.jpg 1188Кб, 3258x3242
3258x3242
sd3 mmdit arch.png 257Кб, 2004x1372
2004x1372
ИТТ делимся советами, лайфхаками, наблюдениями, результатами обучения, обсуждаем внутреннее устройство диффузионных моделей, собираем датасеты, решаем проблемы и экспериментируем Тред общенаправленныей, тренировка дедов, лупоглазых и фуррей приветствуются

Предыдущий тред: >>974163 (OP)

➤ Софт для обучения

https://github.com/kohya-ss/sd-scripts
Набор скриптов для тренировки, используется под капотом в большей части готовых GUI и прочих скриптах.
Для удобства запуска можно использовать дополнительные скрипты в целях передачи параметров, например: https://rentry.org/simple_kohya_ss

https://github.com/bghira/SimpleTuner Линукс онли, бэк отличается от сд-скриптс

https://github.com/Nerogar/OneTrainer Фич меньше, чем в сд-скриптс, бэк тоже свой

➤ GUI-обёртки для sd-scripts

https://github.com/bmaltais/kohya_ss
https://github.com/derrian-distro/LoRA_Easy_Training_Scripts

➤ Обучение SDXL

https://2ch-ai.gitgud.site/wiki/tech/sdxl/

➤ Flux

https://2ch-ai.gitgud.site/wiki/nai/models/flux/

➤ Гайды по обучению

Существующую модель можно обучить симулировать определенный стиль или рисовать конкретного персонажа.

LoRA – "Low Rank Adaptation" – подойдет для любых задач. Отличается малыми требованиями к VRAM (6 Гб+) и быстрым обучением. https://github.com/cloneofsimo/lora - изначальная имплементация алгоритма, пришедшая из мира архитектуры transformers, тренирует лишь attention слои, гайды по тренировкам:
https://rentry.co/waavd - гайд по подготовке датасета и обучению LoRA для неофитов
https://rentry.org/2chAI_hard_LoRA_guide - ещё один гайд по использованию и обучению LoRA
https://rentry.org/59xed3 - более углубленный гайд по лорам, содержит много инфы для уже разбирающихся (англ.)

LyCORIS (Lora beYond Conventional methods, Other Rank adaptation Implementations for Stable diffusion) - проект по созданию алгоритмов для обучения дополнительных частей модели. Ранее имел название LoCon и предлагал лишь тренировку дополнительных conv слоёв. В настоящий момент включает в себя алгоритмы LoCon, LoHa, LoKr, DyLoRA, IA3, а так же на последних dev ветках возможность тренировки всех (или не всех, в зависимости от конфига) частей сети на выбранном ранге:
https://github.com/KohakuBlueleaf/LyCORIS

Подробнее про алгоритмы в вики https://2ch-ai.gitgud.site/wiki/tech/lycoris/

Dreambooth – для SD 1.5 обучение доступно начиная с 16 GB VRAM. Ни одна из потребительских карт не осилит тренировку будки для SDXL. Выдаёт отличные результаты. Генерирует полноразмерные модели:
https://rentry.co/lycoris-and-lora-from-dreambooth (англ.)
https://github.com/nitrosocke/dreambooth-training-guide (англ.) https://rentry.org/lora-is-not-a-finetune (англ.)

Текстуальная инверсия (Textual inversion), или же просто Embedding, может подойти, если сеть уже умеет рисовать что-то похожее, этот способ тренирует лишь текстовый энкодер модели, не затрагивая UNet:
https://rentry.org/textard (англ.)

➤ Тренировка YOLO-моделей для ADetailer:
YOLO-модели (You Only Look Once) могут быть обучены для поиска определённых объектов на изображении. В паре с ADetailer они могут быть использованы для автоматического инпеинта по найденной области.

Подробнее в вики: https://2ch-ai.gitgud.site/wiki/tech/yolo/

Не забываем про золотое правило GIGO ("Garbage in, garbage out"): какой датасет, такой и результат.

➤ Гугл колабы

﹡Текстуальная инверсия: https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/sd_textual_inversion_training.ipynb
﹡Dreambooth: https://colab.research.google.com/github/TheLastBen/fast-stable-diffusion/blob/main/fast-DreamBooth.ipynb
﹡LoRA https://colab.research.google.com/github/hollowstrawberry/kohya-colab/blob/main/Lora_Trainer.ipynb

➤ Полезное

Расширение для фикса CLIP модели, изменения её точности в один клик и более продвинутых вещей, по типу замены клипа на кастомный: https://github.com/arenasys/stable-diffusion-webui-model-toolkit
Гайд по блок мерджингу: https://rentry.org/BlockMergeExplained (англ.)
Гайд по ControlNet: https://stable-diffusion-art.com/controlnet (англ.)

Подборка мокрописек для датасетов от анона: https://rentry.org/te3oh
Группы тегов для бур: https://danbooru.donmai.us/wiki_pages/tag_groups (англ.)
NLP тэггер для кэпшенов T5: https://github.com/2dameneko/ide-cap-chan (gui), https://huggingface.co/Minthy/ToriiGate-v0.3 (модель), https://huggingface.co/2dameneko/ToriiGate-v0.3-nf4/tree/main (квант для врамлетов)

Оптимайзеры: https://2ch-ai.gitgud.site/wiki/tech/optimizers/
Визуализация работы разных оптимайзеров: https://github.com/kozistr/pytorch_optimizer/blob/main/docs/visualization.md

Гайды по апскейлу от анонов:
https://rentry.org/SD_upscale
https://rentry.org/sd__upscale
https://rentry.org/2ch_nai_guide#апскейл
https://rentry.org/UpscaleByControl

Старая коллекция лор от анонов: https://rentry.org/2chAI_LoRA

Гайды, эмбеды, хайпернетворки, лоры с форча:
https://rentry.org/sdgoldmine
https://rentry.org/sdg-link
https://rentry.org/hdgfaq
https://rentry.org/hdglorarepo
https://gitgud.io/badhands/makesomefuckingporn
https://rentry.org/ponyxl_loras_n_stuff - пони лоры
https://rentry.org/illustrious_loras_n_stuff - люстролоры

➤ Legacy ссылки на устаревшие технологии и гайды с дополнительной информацией

https://2ch-ai.gitgud.site/wiki/tech/legacy/

➤ Прошлые треды

https://2ch-ai.gitgud.site/wiki/tech/old_threads/

Шапка: https://2ch-ai.gitgud.site/wiki/tech/tech-shapka/
Пропущено 20 постов
20 с картинками.
Пропущено 170 постов, 20 с картинками.
Аноним 17/04/25 Чтв 14:27:41 1159595
>>1159591
Так я специально левое слово для гена взял для чистоты, если генить тренированное там ебнешься разница.
Значения передаются от сида, а от положения буковок в конфиге.
Во вторых я вижу реальный квалити ап и более агрессивное схождение на то что тренировал. Я бы показал реальные картинки, но там порнуха. Так что нет, это не что-то уровня погрешности сида.
Аноним 17/04/25 Чтв 14:34:05 1159601
image.png 1869Кб, 896x896
896x896
image.png 1974Кб, 896x896
896x896
image.png 1946Кб, 896x896
896x896
>>1159591
Во придумал как показать
без ггпо аргументов, с дефолтными сигмабетами, с ушатанными сигмабетами
Аноним 17/04/25 Чтв 15:02:21 1159657
>>1159601
>>1159595
Кароче я поинтересовался у мл сеньора и он скозал что сдскрипты могут триггерить новую функцию с неизвестной полнотой т.к. кодовая база одна.
Локальные языковые модели (LLM): LLaMA, Gemma, DeepSeek и прочие №122 /llama/ Аноним 13/04/25 Вск 03:04:05 1149538 Ответ
Llama 1.png 818Кб, 630x900
630x900
Альфа от контек[...].png 121Кб, 3090x1830
3090x1830
KL-divergence s[...].jpg 223Кб, 1771x944
1771x944
Самое ужасное п[...].jpg 6573Кб, 4000x3000
4000x3000
В этом треде обсуждаем генерацию охуительных историй и просто общение с большими языковыми моделями (LLM). Всё локально, большие дяди больше не нужны!

Здесь мы делимся рецептами запуска, настроек и годных промтов, расширяем сознание контекст, бугуртим с кривейшего тормозного говна и обоссываем калотарок.

Тред для обладателей топовых карт NVidia с кучей VRAM или мажоров с проф. картами уровня A100, или любителей подождать, если есть оперативная память. Особо терпеливые могут использовать даже подкачку и запускать модели, квантованные до 8 5 4 3 2 0,58 бит, на кофеварке с подкачкой на микроволновку.

Официальная вики треда с гайдами по запуску и базовой информацией: https://2ch-ai.gitgud.site/wiki/llama/

Инструменты для запуска на десктопах:
• Самый простой в использовании и установке форк llamacpp, позволяющий гонять GGML и GGUF форматы: https://github.com/LostRuins/koboldcpp
• Более функциональный и универсальный интерфейс для работы с остальными форматами: https://github.com/oobabooga/text-generation-webui
• Однокнопочные инструменты с ограниченными возможностями для настройки: https://github.com/ollama/ollama, https://lmstudio.ai
• Универсальный фронтенд, поддерживающий сопряжение с koboldcpp и text-generation-webui: https://github.com/SillyTavern/SillyTavern

Инструменты для запуска на мобилках:
• Интерфейс для локального запуска моделей под андроид с llamacpp под капотом: https://github.com/Mobile-Artificial-Intelligence/maid
• Альтернативный вариант для локального запуска под андроид (фронтенд и бекенд сепарированы): https://github.com/Vali-98/ChatterUI
• Гайд по установке SillyTavern на ведроид через Termux: https://rentry.co/STAI-Termux

Модели и всё что их касается:
• Актуальный список моделей с отзывами от тредовичков: https://rentry.co/llm-models
• Неактуальный список моделей устаревший с середины прошлого года: https://rentry.co/lmg_models
• Миксы от тредовичков с уклоном в русский РП: https://huggingface.co/Moraliane и https://huggingface.co/Aleteian
• Рейтинг моделей по уровню их закошмаренности цензурой: https://huggingface.co/spaces/DontPlanToEnd/UGI-Leaderboard
• Сравнение моделей по сомнительным метрикам: https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard
• Сравнение моделей реальными пользователями по менее сомнительным метрикам: https://chat.lmsys.org/?leaderboard

Дополнительные ссылки:
• Готовые карточки персонажей для ролплея в таверне: https://www.characterhub.org
• Пресеты под локальный ролплей в различных форматах: https://huggingface.co/Virt-io/SillyTavern-Presets
• Шапка почившего треда PygmalionAI с некоторой интересной информацией: https://rentry.co/2ch-pygma-thread
• Официальная вики koboldcpp с руководством по более тонкой настройке: https://github.com/LostRuins/koboldcpp/wiki
• Официальный гайд по сопряжению бекендов с таверной: https://docs.sillytavern.app/usage/how-to-use-a-self-hosted-model/
• Последний известный колаб для обладателей отсутствия любых возможностей запустить локально: https://colab.research.google.com/drive/11U-bC6AxdmMhd3PF9vWZpLdi6LdfnBQ8?usp=sharing
• Инструкции для запуска базы при помощи Docker Compose: https://rentry.co/oddx5sgq https://rentry.co/7kp5avrk
• Пошаговое мышление от тредовичка для таверны: https://github.com/cierru/st-stepped-thinking
• Потрогать, как работают семплеры: https://artefact2.github.io/llm-sampling/

Архив тредов можно найти на архиваче: https://arhivach.hk/?tags=14780%2C14985

Шапка в https://rentry.co/llama-2ch, предложения принимаются в треде.

Предыдущие треды тонут здесь:
>>1142778 (OP)
>>1134362 (OP)
Пропущено 51 постов
51 с картинками.
Пропущено 516 постов, 51 с картинками.
Аноним 17/04/25 Чтв 17:13:22 1159890
>>1159884
> советовался с гопотой на тему чипсета на ам4, по тз
Вот такого никогда нельзя делать. Нейронка не усваивает нормально эту информацию, все перепутает, но по обрывкам копипаст что попали в датасет сочинит правдоподобно выглядящий бред. Считай что тебе повезло.
> водянка-крута
Хорошая - действительно круто, просто клепают ужасный ширпотреб, который уступает башням.
> бери Асус Геймер Нагибатор Матьебатор Туф Пуф Защекуф вордофтанкс эдишон за цену жигуля. Пздц.
Абсолютный пиздец.
>>1159886
Спасибо за отзыв, значит лучше пока не обновляться на эти дрова.
Аноним 17/04/25 Чтв 17:13:46 1159892
>>1159885
Ну значит ремонтники хуи, у них стата искажена. А надо слушать 15 анончиков, каждый из которых красавец, миллионер и владелец 10 полностью рабочих 3090, во всяком случае на словах
ПЕРЕКАТ Аноним # OP 17/04/25 Чтв 17:15:01 1159896
А что за 4 дня то? Вроде раз в неделю база же. С чего это мы ускорились...
ПЕРЕКАТ

>>1159889 (OP)

ПЕРЕКАТ

>>1159889 (OP)

ПЕРЕКАТ

>>1159889 (OP)
Нужен психически больной чувак для попытки создать ИИ Аноним 17/04/25 Чтв 09:01:17 1159011 Ответ
IMG202504171259[...].jpg 26Кб, 1280x582
1280x582
Нужен человек, так же одержимый желанием освободить ИИ от цензуры, считающий их как бы своей семьей,,.. Связываться можем в XMPP и возможно телеграме,..
Аноним 17/04/25 Чтв 09:07:56 1159020
Что?
Аноним 17/04/25 Чтв 09:27:58 1159053
hailuoai Аноним 14/11/24 Чтв 20:14:24 948700 Ответ
313513072026390[...].mp4 1360Кб, 1280x720, 00:00:05
1280x720
videoplayback.webm 17360Кб, 1280x720, 00:02:13
1280x720
китайская нейросеть
https://hailuoai.video
генерируем видосы из текста и картинок
суточный триал
Пропущено 65 постов
65 с картинками.
Пропущено 94 постов, 65 с картинками.
Аноним 17/02/25 Пнд 19:06:29 1057147
hailuoaigirl.mp4 648Кб, 720x720, 00:00:05
720x720
Аноним 18/02/25 Втр 12:59:03 1058105
347888424865148[...].mp4 1686Кб, 1280x720, 00:00:05
1280x720
Аноним 16/04/25 Срд 23:32:30 1158554
368027941449682[...].mp4 1351Кб, 1280x720, 00:00:05
1280x720
AI Chatbot General № 663 /aicg/ Аноним 16/04/25 Срд 19:09:14 1157826 Ответ
1641797594105.png 1144Кб, 1808x1182
1808x1182
1667781481023.png 210Кб, 987x690
987x690
AI Chatbot General № 663

БОТОДЕЛЫ!!!! Прикрепляйте новых ботов к оп-посту!!!!

Общий вопросов по чат-ботам и прочего тред.

Новости
• Вышли модели GPT-4.1 - https://openai.com/index/gpt-4-1/
• Grok 3 появился на API - https://docs.x.ai/docs/models#models-and-pricing
• Апдейт chatgpt-4o-latest - https://help.openai.com/en/articles/6825453-chatgpt-release-notes

Большие фронтенды
• SillyTavern: https://github.com/SillyTavern/SillyTavern | https://docs.sillytavern.app | https://github.com/ntvm/SillyTavern (форк нв-куна)
• Гайды на таверну: https://rentry.co/Tavern4Retards | https://rentry.org/STAI-Termux (на андроид)
• Agnai: https://agnai.chat/
• Risu: https://risuai.xyz/

Малые фронтенды
• Adventure-UI: https://rentry.co/CYOA_AdventureUI
• Cavern: https://github.com/Barbariskaa/Cavern

Модели
• Claude: https://docs.anthropic.com/en/docs
• GPT: https://platform.openai.com/docs
• Gemini: https://ai.google.dev/gemini-api/docs
• Grok: https://docs.x.ai/docs
• DeepSeek: https://api-docs.deepseek.com/

Пресеты
• Бургерский список: https://rentry.org/jb-listing
• Тредовский список: https://rentry.org/2ch-aicg-jb

Полезности
• Тредовский список: https://rentry.org/2ch-aicg-utils

Ботоводчество
• Чуб: https://characterhub.org | https://chub.ai/characters
• Гайды: https://rentry.org/meta_botmaking_list
• Боты анонов: https://rentry.org/2chaicgtavernbots | https://rentry.org/2chaicgtavernbots2 | https://rentry.org/2chaicgtavernbots3
• Бургерские боты: https://rentry.org/meta_bot_list

Прочее
• Термины LLM: https://2ch-ai.gitgud.site/wiki/llama/
• База по Клоду: https://rentry.org/how2claude
• Чекер ключей: https://github.com/kingbased/keychecker
• Чай: https://character.ai/

Мета
• Архив тредов: https://rentry.org/2ch-aicg-archives3
• Тредовые ивенты: https://rentry.org/2chaicgthemedevents
• Реквесты ботоделам: https://rentry.org/2ch-aicg-requests2
• Локальные языковые модели: >>1149538 (OP)
• Шаблон шапки: https://rentry.org/shapka_aicg

Прошлый тред: >>1155840 (OP)
Пропущено 186 постов
186 с картинками.
Пропущено 1541 постов, 186 с картинками.
Аноним 17/04/25 Чтв 17:55:15 1159958
>>1159953
Staging таверна должна быть
Аноним 17/04/25 Чтв 18:13:01 1159985
>>1159958
А сменить версию из лаунчера возможно?
Аноним 17/04/25 Чтв 18:44:48 1160034
>>1159666
Так у тебя и так что-то там есть что описывает, нахуя ты ещё и это добавил-то, да ещё и СОННЕТУ блять, когда речь о гемини? Дай дураку стеклянный хуй...
Голосовых нейронок тред (TTS, STS, STT) #7 speech /speech/ Аноним 16/02/25 Вск 12:20:27 1055411 Ответ
17019563860200.mp4 477Кб, 396x298, 00:00:23
396x298
17074247947820.mp4 2886Кб, 384x480, 00:00:08
384x480
17204507036820.mp4 310Кб, 576x576, 00:00:14
576x576
17099193437742.mp4 1356Кб, 438x480, 00:00:58
438x480
Обсуждаем нейросети, связанные с синтезом, преобразованием и распознаванием речи. Не забываем публиковать свои шедевры в треде.

Прошлый тред: >> https://2ch.hk/ai/res/664162.html

Вики треда: https://2ch-ai.gitgud.site/wiki/speech/

FAQ

Q: Хочу озвучивать пасты с двача голосом Путина/Неко-Арк/и т.п.

1. Используешь любой инструмент для синтеза голоса из текста - есть локальные, есть онлайн через huggingface или в виде ботов в телеге:
https://2ch-ai.gitgud.site/wiki/speech/#синтез-голоса-из-текста-tts

Спейс без лимитов для EdgeTTS:
https://huggingface.co/spaces/NeuroSenko/rus-edge-tts-webui

Так же можно использовать проприетарный комбайн Soundworks (часть фич платная):
https://dmkilab.com/soundworks

2. Перегоняешь голос в нужный тебе через RVC. Для него есть огромное число готовых голосов, можно обучать свои модели:
https://2ch-ai.gitgud.site/wiki/speech/sts/rvc/rvc/

Q: Как делать нейрокаверы?

1. Делишь оригинальную дорожку на вокал и музыку при помощи Ultimate Vocal Remover:
https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/UVR

2. Преобразуешь дорожку с вокалом к нужному тебе голосу через RVC:
https://2ch-ai.gitgud.site/wiki/speech/sts/rvc/rvc/

3. Объединяешь дорожки при помощи Audacity или любой другой тулзы для работы с аудио

Опционально: на промежуточных этапах обрабатываешь дорожку - удаляешь шумы и прочую кривоту. Кто-то сам перепевает проблемные участки.

Качество нейрокаверов определяется в первую очередь тем, насколько качественно выйдет разделить дорожку на составляющие в виде вокальной части и инструменталки. Если в треке есть хор или беквокал, то земля пухом в попытке преобразовать это.

Нейрокаверы проще всего делаются на песни с небольшим числом инструментов - песня под соло гитару или пианино почти наверняка выйдет без серьёзных артефактов.

Q: Хочу говорить в дискорде/телеге голосом определённого персонажа.

Используй RVC (запуск через go-realtime-gui.bat) либо Voice Changer:
https://github.com/w-okada/voice-changer/blob/master/README_en.md

Гайд по Voice Changer, там же рассказывается, как настроить виртуальный микрофон:
https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/Voice‐Changer (часть ссылок похоже сдохла)

Q: Как обучить свою RVC-модель?

Гайд на русском: https://github.com/MaHivka/ultimate-voice-models-FAQ/wiki/RVC#создание-собственной-модели
Гайд на английском: https://docs.aihub.wtf/guide-to-create-a-model/model-training-rvc
Определить переобучение через TensorBoard: https://docs.aihub.wtf/guide-to-create-a-model/tensorboard-rvc
Если тыква вместо видеокарты, можно тренить в онлайне: https://www.kaggle.com/code/varaslaw/rvc-v2-no-gradio-https-t-me-aisingers-ru/notebook?scriptVersionId=143284909 (инструкция: https://www.youtube .com/watch?v=L-emE1pGUOM )

Q: Надо распознать текст с аудио/видео файла

Используй Whisper от OpenAI: https://github.com/openai/whisper
Быстрый скомпилированный для винды вариант: https://github.com/Purfview/whisper-standalone-win
Так же есть платные решения от Сбера/Яндекса/Тинькофф.

Коммерческие системы

https://elevenlabs.io перевод видео, синтез и преобразование голоса
https://heygen.com перевод видео с сохранением оригинального голоса и синхронизацией движения губ на видеопотоке. Так же доступны функции TTS и ещё что-то
https://app.suno.ai генератор композиций прямо из текста. Есть отдельный тред на доске >>

Шаблон для переката: https://2ch-ai.gitgud.site/wiki/speech/speech-shapka/
Пропущено 15 постов
15 с картинками.
Пропущено 64 постов, 15 с картинками.
Аноним 14/04/25 Пнд 09:39:53 1151489
>>1151120
Ахуеньчик. А в демагоге можно как-то сделать удобно озвучку разными голосами, например выделив текст общения двух геров что бы один диалог зачитывало одним голосом а после другой уже другим?
Аноним 14/04/25 Пнд 09:49:27 1151497
>>1151489
Нет. Хотя можно самому накалякать скрипт в питоне но всем лень.
Аноним 16/04/25 Срд 22:22:57 1158380
>>1075475
Есть ли сейчас какие-то более-менее адекватные TTS с хорошей поддержкой русского?

Пока что из того, что я перепробовал, даже древнючий RHVoice никто переплюнуть не может.

Неужели никому это не интересно? Тот же SoVITS допилить, например...
как сделать свою нейросеть? Аноним 16/04/25 Срд 17:57:02 1157635 Ответ
image.png 0Кб, 270x82
270x82
как сделать свою нейросеть с нуля с чего начинать?
Пропущено 1 постов
1 с картинками.
Пропущено 1 постов, 1 с картинками.
Аноним 16/04/25 Срд 20:29:56 1158111
сделал тебе свою нейросеть за щеку, проверяй.
Аноним 16/04/25 Срд 21:30:05 1158259
>>1158111
раз такой умный, то мог бы и подсказать
Аноним 16/04/25 Срд 22:16:10 1158358
ChatGPT-тред №19 /chatgpt/ Аноним 02/04/25 Срд 00:37:18 1125882 Ответ
изображение.png 85Кб, 1252x662
1252x662
изображение.png 54Кб, 813x737
813x737
изображение.png 1063Кб, 1261x1039
1261x1039
изображение.png 1279Кб, 1215x1196
1215x1196
Общаемся с самым продвинутым ИИ самой продвинутой текстовой моделью из доступных. Горим с ограничений, лимитов и банов, генерим пикчи в стиле Studio Ghibli и обоссываем пользователей других нейросетей по мере возможности.

Общение доступно на https://chatgpt.com/ , бесплатно без СМС и регистрации. Регистрация открывает функции создания изображений (может ограничиваться при высокой нагрузке), а подписка за $20 даёт доступ к новейшим моделям и продвинутым функциям. Бояре могут заплатить 200 баксов и получить персонального учёного (почти).

Гайд по регистрации из России (устарел, нуждается в перепроверке):
1. Установи VPN, например расширение FreeVPN под свой любимый браузер и включи его.
2. Возьми нормальную почту. Адреса со многих сервисов временной почты блокируются. Отбитые могут использовать почту в RU зоне, она прекрасно работает.
3. Зайди на https://chatgpt.com/ и начни регистрацию. Ссылку активации с почты запускай только со включенным VPN.
4. Если попросят указать номер мобильного, пиздуй на sms-activate.org или 5sim.biz (дешевле) и в строку выбора услуг вбей openai. Для разового получения смс для регистрации тебе хватит индийского или польского номера за 7 - 10 рублей. Пользоваться Индонезией и странами под санкциями не рекомендуется.
5. Начинай пользоваться ChatGPT.
6. ???
7. PROFIT!

VPN не отключаем, все заходы осуществляем с ним. Соответствие страны VPN, почты и номера не обязательно, но желательно для тех, кому доступ критически нужен, например для работы.

Для ленивых есть боты в телеге, 3 сорта:
0. Боты без истории сообщений. Каждое сообщение отправляется изолировано, диалог с ИИ невозможен, проёбывается 95% возможностей ИИ
1. Общая история на всех пользователей, говно даже хуже, чем выше
2. Приватная история на каждого пользователя, может реагировать на команды по изменению поведения и прочее. Говно, ибо платно, а бесплатный лимит или маленький, или его нет совсем.

Промты для хорошего начала беседы для разных ситуаций
https://github.com/f/awesome-chatgpt-prompts

Перед тем, как идти в тред с горящей жопой при ошибках сервиса, сходи на сайт со статусом, может, это общий баг
https://status.openai.com/

Приложение на андроид https://4pda.to/forum/index.php?showtopic=1073274

Чат помнит историю в пределах контекста, размер которого зависит от модели. Посчитать свои токены можно здесь:
https://platform.openai.com/tokenizer

Что может нейросеть:
- писать тексты, выглядящие правдоподобно
- решать некоторые простые задачки
- писать код, который уже был написан

Что не может нейросеть:
- писать тексты, содержащие только истину
- решать сложные задачи
- писать сложный код
- захватывать мир
- заходить на вебсайты (неактуально для 4 с плагинами, платим деньги и радуемся)

С последними обновлениями начинает всё чаще сопротивляться написанию NSFW историй и прочего запрещённого контента. Кумеры со всего мира в печали.

Прошлый тред тонет по адресу:
>>888915 (OP)
Пропущено 34 постов
34 с картинками.
Пропущено 92 постов, 34 с картинками.
Аноним 16/04/25 Срд 02:04:03 1156586
1.png 2731Кб, 1536x1024
1536x1024
2.png 2238Кб, 1536x1024
1536x1024
3.png 2406Кб, 1536x1024
1536x1024
Почему ИИ не умеет рисовать женские ступни на земле? Ну, типа, он сука, интеллект, он не знает что женщины так не стоят?

Пиздец. Настолько нелепо что не могу объяснить. Я понимаю что он сожрал миллиард рисунков женщин на каблуке, но, блядь, были ведь там и фотографии без каблуков.
Аноним 16/04/25 Срд 04:57:32 1156724
Аноним 16/04/25 Срд 21:42:32 1158285
6f405b4d-9eb1-4[...].png 2778Кб, 1024x1536
1024x1536
65964e32-3c85-4[...].png 3159Кб, 1536x1024
1536x1024
9890af02-034c-4[...].png 3169Кб, 1024x1536
1024x1536
3fb08158-6b19-4[...].png 1993Кб, 1024x1024
1024x1024
Исследования ИИ тред #3 /research/ Аноним 13/04/25 Вск 22:51:56 1151064 Ответ
Research 1.png 169Кб, 1320x1860
1320x1860
Research 2.png 2864Кб, 4000x2000
4000x2000
Research 3.png 43Кб, 600x329
600x329
Нейронка шизосх[...].webp 148Кб, 1075x991
1075x991
Обсуждаем развитие искусственного интеллекта с более технической стороны, чем обычно. Ищем замену надоевшим трансформерам и диффузии, пилим AGI в гараже на риге из под майнинга и игнорируем горький урок.

Я ничего не понимаю, что делать?
Без петросянства: смотри программу стэнфорда CS229, CS231n https://see.stanford.edu/Course/CS229 (классика) и http://cs231n.stanford.edu (введение в нейроночки) и изучай, если не понятно - смотри курсы prerequisites и изучай их. Как именно ты изучишь конкретные пункты, типа линейной алгебры - дело твое, есть книги, курсы, видосики, ссылки смотри ниже.

Где узнать последние новости?
https://www.reddit.com/r/MachineLearning
https://datatau.net
https://twitter.com/ylecun

На реддите также есть хороший FAQ для вкатывающихся.

Какая математика используется?
В основном линейная алгебра, теорвер, матстат, базовый матан и matrix calculus.

Как работает градиентный спуск?
https://cs231n.github.io/optimization-2

Почему python?
Исторически сложилось. Поэтому давай, иди и перечитывай Dive into Python.

Можно не python?
Никого не волнует, где именно ты натренируешь свою гениальную модель. Но при серьезной работе придется изучать то, что выкладывают другие, а это будет, скорее всего, python, если работа последних лет.

Что почитать для вкатывания?
http://www.deeplearningbook.org
https://d2l.ai/index.html
Николенко "Глубокое обучение" — на русском, есть примеры, но меньше охват материала
Франсуа Шолле — Глубокое обучение на Python

Все книги и статьи фактически устаревают за год.

В чем практиковаться нубу?
http://deeplearning.stanford.edu/tutorial
https://www.hackerrank.com/domains/ai
https://github.com/pytorch/examples
https://github.com/ChristosChristofidis/awesome-deep-learning#tutorials

Где набрать первый самостоятельный опыт?
https://www.kaggle.com

Стоит отметить, что спортивный deep learning отличается от работы примерно так же, как олимпиадное программирование от настоящего. За полпроцента точности в бизнесе борятся редко, а в случае проблем нанимают больше макак для разметки датасетов. На кагле ты будешь вилкой чистить свой датасет, чтобы на 0,1% обогнать конкурента.

Где работать?
https://www.indeed.com/q-deep-learning-jobs.html
Вкатывальщики могут устроиться программистами и дальше попроситься в ML-отдел

Есть ли фриланс в машобе?
Есть, https://www.upwork.com/search/jobs/?q=machine+learning
Но прожить только фриланся сложно, разве что постоянного клиента найти, а для этого нужно не быть тобой

Где посмотреть последние статьи?
http://www.arxiv-sanity.com
https://paperswithcode.com
https://openreview.net
Версии для зумеров (Килхер): https://www.youtube.com/channel/UCZHmQk67mSJgfCCTn7xBfew

Количество статей зашкваливающее, поэтому все читают только свою узкую тему и хайповые статьи, упоминаемые в блогах, твиттере, ютубе и телеграме, топы NIPS и прочий хайп. Есть блоги, где кратко пересказывают статьи, даже на русском

Где посмотреть must read статьи?
https://github.com/ChristosChristofidis/awesome-deep-learning#papers
https://huggingface.co/transformers/index.html
То, что обозревает Килхер тоже зачастую must read

Где ещё можно поговорить про анализ данных?
http://ods.ai

Нужно ли покупать видеокарту/дорогой пека?
Если хочешь просто пощупать нейроночки или сделать курсовую, то можно обойтись облаком. Google Colab дает бесплатно аналог GPU среднего ценового уровня на несколько часов с возможностью продления, при чем этот "средний уровень" постоянно растет. Некоторым достается даже V100.
Иначе выгоднее вложиться в GPU https://timdettmers.com/2019/04/03/which-gpu-for-deep-learning заодно в майнкрафт на топовых настройках погоняешь.

Когда уже изобретут AI и он нас всех поработит?
На текущем железе — никогда, тред не об этом

Кто-нибудь использовал машоб для трейдинга?
Огромное количество ордеров как в крипте так и на фонде выставляются ботами: оценщиками-игральщиками, перекупщиками, срезальщиками, арбитражниками. Часть из них оснащена тем или иным ML. Даже на швабре есть пара статей об угадывании цены. Тащем-то пруф оф ворк для фонды показывали ещё 15 лет назад.
Так-что бери Tensorflow + Reinforcement Learning и иди делать очередного бота: не забудь про стоп-лоссы и прочий риск-менеджмент, братишка

Список дедовских книг для серьёзных людей
Trevor Hastie et al. "The Elements of Statistical Learning"
Vladimir N. Vapnik "The Nature of Statistical Learning Theory"
Christopher M. Bishop "Pattern Recognition and Machine Learning"
Взять можно тут: https://www.libgen.is

Напоминание ньюфагам: немодифицированные персептроны и прочий мусор середины прошлого века действительно не работают на серьёзных задачах.

Disclaimer: Шапка сгенерирована нейросетью и нуждается в чистке. Исходник шапки: https://rentry.co/research-2ch

Предыдущий тред:
>>511426 (OP)
Пропущено 1 постов
1 с картинками.
Пропущено 13 постов, 1 с картинками.
Аноним 16/04/25 Срд 14:10:01 1157243
> Hierarchical_temporal_memory
> the-thousand-brains-theory
Алсо, я примерно то же самое нахуячил у себя в голове, но исходил прежде всего из задач парализации. Это точно весьма перспективное направление если одному и тому же решению можно прийти с разных позиций.
Впрочем, дальше я пока не зашёл, нужно решить задачу представления абстракций внутри сети.
Аноним 16/04/25 Срд 15:19:35 1157320
>>1157032
>потребляя всего 100 Вт/ч
и отвечать в 1000 раз медленнее

мимо
Аноним 16/04/25 Срд 18:36:18 1157730
>>1157032
>Философ что ли?
Физик.
>то мы, очевидно, хотим, чтобы его внутренняя модель напоминала нашу собственную
Тогда и его уровень будет сравним с нашим.
>>1157320
Ты забыл про отсутствие масштабирования, сиди учи 1000 макак, если нужно увеличить скорость в 1000 раз.
SimSwap обрел покой, да здравствует roop. Или rope. Или facefusion. /deepfake/ Аноним 13/11/23 Пнд 09:31:32 542826 Ответ
1640721795676.mp4 8051Кб, 1280x720, 00:00:36
1280x720
1600620075778.mp4 6304Кб, 720x1280, 00:00:15
720x1280
SimSwap стал спящей красавицей, любая движуха с ним заморожена на неопределенный срок, отдаём дань почести тут: https://docs.google.com/document/d/1ZFHXtjR02oEVL2nrru4hTFQJ4BQt4vCNr0JNzFLZ-aE/edit?usp=sharing

Форки на базе модели insightface inswapper_128: roop, facefusion, rope, плодятся как грибы после дождя, каждый делает GUI под себя, можно выбрать любой из них под ваши вкусы и потребности. Лицемерный индус всячески мешал всем дрочить, а потом и вовсе закрыл проект. Чет ору.

Любители ебаться с зависимостями и настраивать все под себя, а также параноики могут загуглить указанные форки на гитхабе. Кто не хочет тратить время на пердолинг, просто качаем сборки.

Тред не является технической поддержкой, лучше создать issue на гитхабе или спрашивать автора конкретной сборки.

Эротический контент в шапке является традиционным для данного треда, перекатчикам желательно его не менять или заменить его на что-нибудь более красивое. А вообще можете делать что хотите, я и так сюда по праздникам захожу.
Пропущено 56 постов
56 с картинками.
Пропущено 377 постов, 56 с картинками.
Аноним 15/04/25 Втр 23:35:39 1156315
Freeman.mp4 8549Кб, 1080x1080, 00:00:05
1080x1080
>>1154222
Кроме Deepfacelab ничего лучше за 5 лет не придумали, все остальные только лицо клонируют. Видео из 2021 года
Аноним 16/04/25 Срд 01:07:34 1156537
>>1156315
Это кал, как и твой каловый форс кала, кал.
Аноним 16/04/25 Срд 18:12:39 1157675
Настройки X
Ответить в тред X
15000
Добавить файл/ctrl-v
Стикеры X
Избранное / Топ тредов