>>1108793 → Никогда не замечал такого, дело не в ускорялках? >>1108818 → Little girl riding a huge shaft >>1108862 Белая субстанция входит в дресс код? >>1108863 2 четкая, и такое белье лучше чем его отсутствие.
>>1108657 → Да, я неправильно спросил, наверное. Жирнотеги я знаю, а вот что за рисовака был на скрине? У нормального художника такая жирдяйка не выйдет, даже если вес тегам задирать. Или тут лора использована?
>>1108908 "Вот и дура! Ну конечно, снять панталоны — гениальный план! Теперь у меня не жопа, а два ведра мороженого в режиме суперзаморозки! Ветерок, гадёныш, раньше юбку поднимал, а теперь — прямо под подол залетает, как в тоннель метро! Хвост? Ох, этот «пушистый спасатель»… Ты же должен грешить, простите, греть! А он виляет, будто вентилятор, да еще и подставляет меня под все сквозняки!
А еще эти взгляды… Раньше пялились на уши, теперь — на дрожащую попу. «Ой, смотрите, она вся трясется! Это новая модная фишка?» Да, фишка! Фишка под названием «Моя жизнь — сплошной дисбаланс терморегуляции»! Хочу обратно в панталоны… Но нет, гордость не позволяет. Придется изображать, что мне так задумано. «Я? Дрожу? Нет, это я… э… танцую! Шаманский танец! Вам не понять!»
Эх, мечтала о свободе — получила вечную войну с законами физики. Лето, ау? Где ты?! Вернись, я всё прощу! Или дайте мне хоть газету подложить… Нет, лучше пойду на солнце. Греть… ту самую точку. Решительно шагает к солнечному пятну, волоча за собой хвост, как одеяло. «Прекрасно, — думаю, — сейчас я прогреюсь…» А солнце, как на зло, прячется за тучи. Ну конечно. Просто идеально."
Никто не сталкивался с такой проблемой, что когда СД рисует сложную композицию, вроде "персонаж в замысловатой одежде сидит на стуле, куча мелких деталей, фон хорошо прорисован", если какую-то часть картинки перекрывает что-то с "переднего плана", например кусок одежды, то зачастую, задний фон сверху и снизу не сходится. Как релейтед, стул нарисован неправильно, из-за того что он перекрыт одеждой. Никто не знает, как это можно починить? Кроме как самому в какой-то другой программе. Чекпоинт WAI-NSFW-illustrious-SDXL.
>>1108977 >Как релейтед, стул нарисован неправильно, из-за того что он перекрыт одеждой. Никто не знает, как это можно починить? Стереть стул, заинпэйнтить ровно, вернуть стул. Придётся немного поработать ластиком в фоторедакторе.
>>1108977 Общая проблема нейронок. Исправляй руками. >>1108982 Генерить заново дольше будет, потому что это встречается постоянно. Горизонт современные модели научились кое-как держать и то не всегда получается, но со сложной геометрией прерывающихся линий лажают в 90% случаев.
>>1109011 >но со сложной геометрией прерывающихся линий лажают в 90% случаев. Я возлагал некоторые надежды на сэмплеры типа TCD, но там какое-то странное поведение. Картинка разве что становится резче.
>>1108868 > не видно задницы Потому и интересно >>1108952 > Нет, лучше пойду на солнце. Греть… Правильно >>1108977 Нейронка, где-то такого больше, где-то меньше.
>>1108977 Это все модели делают, кто-то в большей степени, кто-то в меньшей, исправляется инпеинтом. Ну и выбором промптов так, чтобы неевклидовая геометрия в глаза не бросалась. Мебель, перила, лестницы, персонаж загораживающий горизонт и т.п. - это потенциально проблема для сдхл, а для сд1.5 - смерть.
Но раз в несколько роллов вполне можно поймать вариант, где исправлений на минуту и на этом забить. Отдельным слоем проводишь линии как должно быть, потом докрашиваешь примерно под то, что нужно и вперед инпеинтить.
>>1109091 Флуксы и около тоже могут так скосячить, но да, сильно реже и не на десятки сантиметров, как сдхл.
Ну, что я могу тебе сказать, анон, попердолившись целый день. Пока что, пожалуй, оно того не стоит. То, что запустилось после пердолинга показывает хорошо если +15% при росте жора на 33%. Объём памяти дополнительный пока особо и не нужем ни для чего.
Без пинка ничего само не работает. Где-то хватает в готовый венв запихать новый торч:
Где-то этого мало, и оно наоборот ломает венв. Форж так завелся. Рефоржу пришлось ставить заново венв. Автоматик ломается совсем. В Угабуге только жорин загрузчик так работает. Изи скриптам надо ещё кроме торча:
Экслама, тэггеры не взлетели вообще. Хорошо, что это не единственная карта в системе, иначе просто жеппа бы сгорела. В инете полно мануалов, но всё такое ещё костыльное, что уже дальше смотреть не охота. Надо ждать, когда устаканится, если хочется с одного клика.
Как-то так. Ждём раскрытия потанцевала, спосеба, Хуанг нет
>>1109256 > То, что запустилось после пердолинга показывает хорошо если +15% при росте жора на 33% Собственно почему я пока решил пропустить 5090, как-то выигрыш не тот, который стоит апгрейда с 4090, в особенности с учётом тдп в 600вт.
>>1109227 Спасибо! >>1109256 Не грусти, после пинков все (технически) можно завести. К сожалению, на данный момент нужно пинать очень интенсивно и в самые болевые точки. Но со временем разомнут и будет само ставиться, карточка имеет хороший потанцевал по мощности и лишняя память очень ценна. Если не интересует душная сводка что и почему не работает - можешь скипать то что нижен.
> Рефоржу пришлось ставить заново венв
Там автор намутил хардкода и сам в нем запутался. А еще малость не тот хформерс собрал, из-за чего при автоматической установке оно вообще может поломаться. Хотя может уже и все починено, он же очень активно коммитит. > Автоматик ломается совсем Под него есть в ишьюсах гайд с костыльным торчем 2.6 кем-то собранным, или срабатывает по той же схеме с найтли торчем с сайта. > В Угабуге только жорин загрузчик так работает. Проблема убабуги в хардкоде билдингов, невероятная удача что питоновская обертка жоры завелась, но неработоспособность экслламы и флешатеншн вполне закономерна. Трейнер кохьи летает, но если хочешь получить фулл перфоманс и гонять на нескольких карточках - потребуется пройти долгий путь с патчами серии пакетов, начиная с исправлений в хуанговских лабах nccl и их сборки. > Экслама В готовом энве она работает без вопросов, но вот найти готовый фа под найтли торч на виндоуз задача уже нетривиальна. > тэггеры Теггеры используют или функции торча, и тут нужен только правильный венв, или onnx - земля пухом (обычная версия собирается, дев для тренировки почему-то не проходит тесты), или трансформерс - вот его нужно просто ставить с их репы в подходящее окружение и все будет работать.
TLDR - амудээкспириенс с той лишь разницей, что не приходится лезть уж совсем в низкоуровневые штуки и (регулярно) чистить за разрабами. Если шаришь - даже понравится, если хочешь легкости и комфорта - лучше подождать. Проблема в первую очередь в низкой распространенности карт на фоне больших изменений, те кто должен все это фиксить у себя в пакетах банально не могут позволить купить себе старшую модель, а младшие нахуй не нужны. Из плюсов - карточка действительно быстрая если правильно приготовить, андервольтится до 400-450вт без заметного импакта на перфоманс.
>>1109292 Писос, это масло на коже и блики на волосах почти сквозь все пробивается, исключение единицы. Большинство знакомых на себя не похожи (может пример неудачный), некоторые протекают тегами. > на основе ваи Могло быть и хуже, лол. >>1109390 > на базовом Можно начать с него
>>1109432 >Её же как раз в 24 гига впихнули, так что и обычных карт хватало. i2v 720p не лезет в 24гб например, ну и если увеличивать длительность тоже надо больше.
>>1109283 Угу. По ощущениям пока самый тухлый апгрейд в цепочке: цпу - 3060 - 3090 - 4090. А самым крутым очевидно ощущался самый дешёвый - бу 3060 с лохито
>>1109292 Я себе папку запилил куда накидал себе превьюхи с художниками 316 уже отобрал которых люстра/нуб вкуривают Уже чисто ради интереса вбиваю всех до кого руки дотянутся xD
>>1109480 >Почему? Она отзывчивее на промпт? Ну в целом да, при миксовании все время что-то теряется. И композицию часто более разнообразную выдает, хоть и корявую. И лоль хорошо рисует
>>1109639 можно подробнее? Как я понял у меня наебнулся файл parallel в strategies в lightning_fabric, как его скачать нормальный не переустанавливая всё сразу я хз.
>>1109654 >Название папки странное Это да, я накопал изначальный архив в загрузках, там нету такого. Видимо через апдейт скачалось в своё время.
>>1109654 >Клонируй репо руками Если я правильно понял, ты имеешь ввиду скачать модуль с гитхаба и закинуть в папку. Я так сделал, но не помогло, тк какой-то другой стоял.
>>1109654 >запускай создание венв оттуда Как? Меня гайд научил только батник запускать. Я venv только в пайчарме делал через галочку.
P.S. походу придется переустанавливать из архива .
>>1109647 Я думаю, это второстепенное расширение для Forge и ты его можешь безболезненно грохнуть вместе с папкой, где оно находится (но благоразумнее будет забэкапить её куда-нибудь). По моему мнение - если расширение не написано так, что оно запускается, то оно и не нужно.
>>1109644 >>1109613 Хороший флэт стиль. В последнее время я думаю, что твикеры и SAG на моих старых генерациях были лишними, потому что картинка хуже читается. в любом случае, я не понял бы этого, если бы не тестил всё подряд.
>>1109671 >Я думаю, это второстепенное расширение для Forge и ты его можешь безболезненно грохнуть вместе с папкой, где оно находится (но благоразумнее будет забэкапить её куда-нибудь). Я пробовал, он тогда не хочет работать.
Возможно, если найти файл, где расширение импортируется, и отключить импорт со всеми ссылками на него ничего не изменится, но это уже совсем пиздец, легче уж переустановить за полчаса-час.
Кому-нибудь попадалась приблуда, которая рисует максимальный отклик токена в клипе конкретной рисовальной нейросетки, а не специально настасканной на генерацию аниме? Я пробовал DAAM, но не смог даже запустить его, потому что проект сильно устарел и связность его пакетов утрачена.
>>1109517 Ну это хуйня полная, все какие-то одинаковые жирные шлюхи, хуй что найдешь, не по алфавиту. От анона выше гораздо более информативная картинка.
>>1109740 Комфи - это лапша для пердоликов, чтоб показывать другим трансам в дрискордике как красиво ноды навертела. Эта хуйня для имейжгена не предназначена
>>1109778 если я продемонстрирую фикс Можешь в шапке посмотреть на козу из вувы и лоли на коллаже. В прошлом треде сервал, чокола, пепе, тоходевка в пещере, девка-волшебница с автоматом
>>1109758 имхо лапша какая то перемудреная, со всеми этими построениями нодов и прочей хуетней, чет на эльфийском. В вебуи как то проще с сухими цифрами возится. Хуйнул ползунки, нажал кнопку = получил свою кошко жена и миска рис. п.с. Не ну может там какой то особый путь и супер фишки, но субьективно вот сижу я форже и нормуль.
>>1109746 Можно еще на цивите целый гайд генерации и составления нодов запилить :d
>>1109789 > имхо лапша какая то перемудреная, со всеми этими построениями нодов и прочей хуетней, чет на эльфийском. Так это всё не для того, чтобы этим напрямую пользоваться. API у комфи отличный, да и свои ноды писать очень просто, несоизмеримо проще, чем делать extension для любого А1111-подобного - и это то, решает.
А чтобы комфи удобно было пользоваться, берешь krita-ai-diffusion - и у тебя и лучший интерфейс для работы с модельками, и весь функционал комфи.
>>1109778 Нет, старые запасы опустошу и тогда посвежее пойдёт, когда я странные твикеры перестал использовать и перешёл на новую модель, у которой очень мягкий стиль рендера. А пока терпи. Ну или подкинь адекватную идею для свежего реакшона, так чтобы мне было интересно.
>>1109789 >построениями нодов и прочей хуетней, чет на эльфийском. Это одноразовая работа. Когда основной инструментарий из воркфлоу сложился, меняются в основном промпт, лоры и модели. Ты можешь вообще не включать мозг и просто скачать готовые воркфлоу, а потом просто найти в них поле ввода для промпта и пошаманить над именем модели и CFG.
>>1109797 >А чтобы комфи удобно было пользоваться, берешь krita-ai-diffusion Художникам это больше заходит.
Странно. Сегодня конкурс на цивите кто-то попробовал испортить, загрузив фейковую лору, из-за которой все генерации с ней удалялись из коллекции контеста. Я стуканул куда надо, и через полчаса фейк снесли. Лора висела целый день и мешала куче людей. На западе не умеют пользоваться кнопкой report? У меня нет связей совершенно, я просто использовал штатные средства.
>>1109854 > адекватную идею Больше безумия у Лапы, чтобы видно было насколько поехавшая а не просто дженерик вангерл. И позу какую-нибудь недефолтную. >>1109869 Поделись промтом на эту лисичку и конечный стиль, нравятся
>>1109902 >Больше безумия у Лапы, чтобы видно было насколько поехавшая Лаппланд - девочка из хорошей семьи, и ночью с сомнительными личностями из дома не выходит.
>>1109977 >>1109937 Уже хватает на лору, если флипать. Но я думаю, проще подобрать промпт. Ядро промпта может быть таким: <стиль художника?>, 1girl, fox girl, partially colored, monochrome, red colored inner hair, purple eyes, long hair, red animal ear fluff Ситуативные токены: lycoris, samurai, cake, coffee cup, eastern-asian architecture, cafe, table, katana, pillow и так далее.
>>1110022 Стиль художника скорее всего зашумлен промптом и его тяжело угадать кроме как перебором. Возможно, это дефолтный стиль какого-то из новых люстромиксов.
Для непотребств лисы со всеми фетишами и личным персонажем проще обучить лору, я думаю.
>>1109977 Ля какая! Конечно же ну немножко >>1109988 > after_ headpat и cuddling >>1109993 Во, вот эта уже интереснее гораздо, хорош >>1109995 Страшна!
>>1110048 ну там разный стиль, некоторый это мои лоры, а лиса в целом дженерик 1гирл, красный волос, сисик, асс фокус, ну и так от себя там накидал немного.
>>1110097 анимешарп юзаю, сравнивал с другими, с ним лучше результат
Я исследовал возможности люстры и случайно обнаружил, что она почти перфектно рисует драконов, хотя на цивите непропорционально мало артов с ними. Как запромптить дракону позу лежания по-кошачьи, когда лапы подбираются под боками (пик 1)? Наиболее логичный токен lying на пробной выборке картинок укладывает дракона на полубок как пик 2. Токен lying on stomach укладывает ровнее (пик 3), но дракон поднимает жопу. Токен lying on front опускает крестец ниже, но он не касается земли.
>>1110806 Не знаю, попробуй 0.7 0.7, 0.5 0.5 и т д пока не получишь результат который устаревает тебя, ещё модель контролнета может не подходить к модели
>>1110781 пропробуй уменьшить силу контролнета (обычно 0.3-0.9 в зависимости от эффекта), и еще если модель с разными типами контролнетов попробуй вручную указать
>>1110918 >Есть кстати смысл кому-то писать чтоб в новую версию все таки персонажей с доты добавили? Да. В спортлото. Просто берешь и делаешь сам без задней мысли
>>1110781 Блять, проиграл. Кто решил, что сделать подобный UI, это хорошая идея. Не могу сказать, что фордж какой-то особо удобный или интуитивный, но это же совсем пиздец.
>>1110918 >У меня щас ваи 11 стоит, надо новую 12 версию скачивать? Что там нового есть вообще? Не знаю, но я в отзывах на цивитае видел краем глаза, мол у 12-й версии, за основу как будто взята 10-я, а не 11-я, и это мол, хорошо. >>1110943 Чем лучше?
>>1110980 ну я сейчас переполз с люстры на нуба, лучше шарит за промт, там где люстра фейлит или не дает чего нужно, нуб справляется нормально. лоры с люстры работают нормально. Все что тренил нормально запустилось, но нуб и так стилей и персов знает дофига. На скок знаю (но это не точно) база у нуба шире люстры Сидел на 12 люстре но при сравнении и тестах, ваи соснул у того же нуба от него.
>>1110985 Эта старушка выкакала пару лет назад игру в стим хентайную где арты полностью выкакивались ей. У меня есть модель, но уже думаю древняя, может что новее и лучше есть. Если думаешь что я собрал на 1 1060 пускать и ллм и сд, то нет, у меня две 1060
>>1109292 Ебать как охуенно, совсем забыл что можно стили делать не лорами, мне арт баалбади нравится и я кайфовал от его темпл-химе-бимбо, а тут делай в таком стиле какую хочешь, так еще и в цвете.
>>1111028 Да не, окупила себя трижды, только тогда был подъем на этот кал. И таких игр высирали так много, что они нахуй никому не нужны. Нужно ещё 3 года ждать чтобы карточки добавили, тогда можно в черную продавать. Модель то посоветуете, или будет на мою 1060 гнать?
>>1111036 >окупила себя трижды Не то что бы достижения для 1060. >Модель то посоветуете Идешь на цивит, настраиваешь сортировку - либо по лайкам, либо по дате. Смотришь, что понравится. Качаешь, проверяешь. Понь, кстати, есть и в версии SD 1.5. Можешь его попробовать. Или миксы на нем. Чел, тут уже давно с полторашных моделей все пересели на более современные, никто тебе ничего не посоветует из "актуального". Только из древних времен, по типу энифинга или какого-нибудь футанари-фактора.
>>1111034 Хуясе, 12гб врам, качаю Easyfluff, мне качество ебанутое не нужно, хоть пусть 5 рук высирает. Для таверны, разрешением хз, 300 на 300 с ожиданием в 3-4 минутки на 1 генерацию. >Чел, тут уже давно с полторашных моделей все пересели на более современные, никто тебе ничего не посоветует из "актуального". В бой идут одни старики >по типу энифинга Вот пожалуйста, на нём я и какал раньше, спасибо что напомнил как же он назывался.
>>1110781 This is madness! Madness? This is Comfy! А получается плохо потому что пони на модели с таким примитивным промтом, там обязательно навалить скоров, негатив и использовать понятные теги, иначе это считается нормальным результатом. Также скорее всего контролнет с моделью не совместим. >>1110956 Хорошо, мило, богоугодно! Кайфанул с тени, четко, спасибо
>>1110966 Что-нибудь на люстре ужатое в фп8 или с другими оптимизациями. Будет тяжело, лучше обновись при первой возможности. >>1110988 Жопа! >>1111021 wai - прямой идеологический наследник >>1111039 Как она хвост туда просунула?
>>1110943 >>1110988 тут какой-то наеб, только что попробал нуб твой поставить и результат на пик1, пик2 авг результат с тем же промптом/лорами/семплером итд
Вот бы кто поделился вайлдкардами. Ну я все понимаю. Но те что есть либо хуйня из нейросетей с тысячей вариантов одного и того же другими словами, либо просто неюзабелный треш. Вот мооожет быть кто то поделится. Или тут только самому под себя все делать...
>>1111146 >Также скорее всего контролнет с моделью не совместим. Это было первое, что пришло мне в голову, но я копнул эту тему и выяснил, что суффикс _pn_ у контролнета означает не "пошёл нахуй", а предназначение для понимоделей.
>>1110988 >На скок знаю (но это не точно) база у нуба шире люстры Я уже задолбался отлаживать, почему нуб снова выдаёт разводы пикрил, словно у него не совпадает VAE (запечённые vae и vae из примеров с витрины дают одинаково неаппетитный эффект). При этом в другие разы он выдавал какой-то вразумительный результат. Вроде я прокинул нужные настройки, но чего-то снова не хватает. Придётся со старых генераций всё буквально копировать, хотя там много чего ещё нет. Сколько-то ещё времени пройдёт, пока vpred начнёт нормально работать из коробки, а не вот это всё.
>>1111285 Ты только что поделил на ноль. Если в треде постоянно жалуются на то, что нуб сложно использовать, это не является состоянием "запускается из коробки".
>>1111318 Сэмплер один и тот же. Схемы идентичны. Но все vpred на моей машине выдают характерные разводы, а на tensorart в облаке выдают чёткую картинку. Эпсилон-модели такую мощную разницу не демонстрируют.
>>1111399 >Че у тебя, дай пнг с датой, на чем запускаешь, промта подсыпть, так же хрен поймешь Методом перебора я заключил, что сильную порчу вносил один из эмбеддингов в негативном промпте. На тензор арте эмбеддинг был не установлен, вероятно, поэтому вредного эффекта несовместимый токен эмбеддинга не оказывал.
Одна из в-пред моделей не работает просто потому, что она всегда мыло генерирует, даже на витрине это заметно (хотя черрипикнуты так, чтобы это не оказывало влияния на впечатление).
Пиздец, какие же драконы на нубе вариативные. Придётся использовать лору на единственный тип дракона или стабильный люстромикс, потому что запромптить дракона токенами практически нереально, вариативность слишком сильная и я не знаю, управляема ли она токенами. Насколько я понимаю, уровень подробностей ограничивается чем-то вроде western dragon, head fins.
>>1111390 >этот для нуба Потыкал рандомных персонажей, довольно впечатляюще, находятся даже очень обсукрные вещи, на данборе по ним дай бог 10 картинок есть, а то и меньше.
>>1111146 >А получается плохо потому что пони на модели с таким примитивным промтом, там обязательно навалить скоров, негатив и использовать понятные теги, иначе это считается нормальным результатом. Также скорее всего контролнет с моделью не совместим.
>>1111593 >понимание разговорного языка Да эти дебилы дегенеративные в каждой XL модели про это пишут. И сами сд-петухи тоже писали про это, наверняка. XL-калище не способно, у него токены текут как бляди. Топчутся на месте, тратят ресурсы придурки ебучие вместо того, чтобы файнтюнить новые модели. Трясёт уже от подобных. Сотни файнтюнов, все одинакого качества, вместо одного на современной модели.
>>1111619 > не понимает разницу между файнтюном и васян-инцест-миксом > требует чтобы ему срочно все сделали > лучше всех знает что надо делать > делает ничего Васян-кккомбо
>>1111619 > Сотни файнтюнов Где? Сплошной инцест, мерджи весов, запекание лор, "я намерджил хуету но потом добавил свою лору поэтому это трейнед модель", "я скачал тысячу пикч и запустил файнтюн, смотрите". Виноваты в этом как абузящие систему ради наживы (даже люстра превращается в скам), так и само комьюнити, что это поощряет. Модели с пониманием и прочим мало кому нужны, если так посчитать, дженерик слоп как можно проще, а то и вообще пони. > XL-калище не способно, у него токены текут как бляди. Заявления из уст чела, который не понимает значение слова токен.
>>1111637 >Сплошной инцест, мерджи весов, запекание лор, "я намерджил хуету но потом добавил свою лору поэтому это трейнед модель", "я скачал тысячу пикч и запустил файнтюн, смотрите". Иногда так получаются довольно приятные стили по контрастности или живописности. Не всегда и не всем нужна супервариативная модель типа noobai, где промптингом довольно проблематично добиться желаемого и остаётся только морозить вариативность лорами или генерить сотни картинок, чтобы отобрать СОС МЫСЛОМ.
>>1111681 Ну да, кому-то норм жрать слоп на уровне аутизма, где на любом сиде по промпту выдает абсолютно одинаковый ракурс/позу Вообще забавно, что ваи имеет в названии НСФВ, когда для нсфв хуже шитмикса просто нет. Если чето сложнее пов ковгерл, то анатомия проебана максимально, позы одни и те же всегда
>>1111712 >на любом сиде по промпту выдает абсолютно одинаковый ракурс/позу У меня так на впред нубе. Слабо креативит пока не пропишешь всё сам, или в попытках креативить выдает чушь сломанную. Хотя если тебе нужно что-то абстрактное, то это ок. Но и на ваи или других миксах особо проблем не было если всё детально расписывать.
>>1111512 Ну хрома (это обрезанный дедистилл флукса который lodestones тренирует сейчас) будет, на её базе что-то неплохое наверняка сделают, пощупать ранние версии можно уже сейчас, чекпоинты регулярно на хф скидываются.
Пони в7 - тоже тренируется, что с ней будет пока не понятно. Те примеры которые не сломаны, почему-то все равно выглядят пережаренными насмерть.
>>1111593 Так это всё равно будет сдхл c CLIP'ами, так что чего-то прям безумного с пониманием естественного языка я не ожидал бы. Т.е. можно и так потыкать не-аниме тьюны сдхл и понять, что оно будет весьма ограниченное.
>>1111746 >У меня так на впред нубе. Он, да, немного странный в этом плане по сравнению с эпс версией, тоже такое на нём замечал, в особенности на совсем коротких промптах.
>>1111681 Стили достижимы в нормальной модели и этому подходу уже больше 1.5 лет начиная с hll (а если брать зарю 1.4-1.5 и боку@жоку то вообще 2.5). Любители полторашного инцеста и аутизмодети только сейчас постепенно к этому приходят, открывая возможности использовать встроенных артистов, и даже довольны тем, как оно работает в слопомиксах. Нет ничего зазорного в том, чтобы использовать слопомикс или что угодно, особенно если ты ньюфаг или не привередливый. Но нужно понимать что это и какой ценой дается та самая простота, пока не надоест. И что это - рак, который и тормозит развитие. > промптингом довольно проблематично добиться желаемого Нуб, конечно, специфичен, но не настолько. Наоборот, с этим на слопмиксах беда.
>>1111950 Не даст конечно, клип довольно слабенький. Если взять пример из прошлого треда, то мелкий клип нормально не может по эмбеддингам найти те же кубы, стоящие друг на друге, или просто кубы, или кто-то на них сидит. Siglip2 400m 512 может находить типа детских игрушек или стоящие друг на друге кубики с сидящими рядом, сидящими на стопках сниг, или даже вот такое https://danbooru.donmai.us/posts/6646599 Скорее всего то что находит уже решает разрешение с которым подобное может разглядеть, а что не может подобрать много вариантов персонажами, сидящими на стопке - почти нет таких пикч в наборе для сравнения. Но даже если взять его - это лишь 64 токена, хуже чем 75 в клипе. Потенциальная реализация заведомо ограничена таким, и деление на чанки на пользу не пойдет. Сюда же качество капшнов с которыми обучают. Если будет ерунда, то кроме как херни > The picture depicts an anime art where girl with blue hair is standing on the left and girl with purple hair standing on the right научить не получится, пойдет только во вред. Учитывая насколько по дефолту продамажен энкодер люстры, это еще сильнее снижает вероятность успеха.
>>1112060 > Но даже если взять его Да в этом плане проще ничего не придумывать и взять любую связку T5 + DiT и забить, как все и делают.
Либо вообще дождаться нормальной тру-мультимодалки в опенсорсе, а-ля проприетарные гемини 2.0 image generation или вот буквально час назад вышедшего нативного имгена у 4о, и сразу все усилия в файнтьюн её пустить. Вот там, конечно, всем некстгенам некстген по возможностям.
>>1112106 > любую связку T5 + DiT Т5 по дефолту - залупа, просто так оно не работает как хотелось бы. Новелы опубликовали свою реализацию подходов к готовке правильного энкодера, но тема сложная. > тру-мультимодалки в опенсорсе Внезапно оно уже несколько месяцев есть, в ллм-треде скидывали бумагу, если найду при случае притащу, или кто-нибудь еще скинет. Там нет никакой "тру" мультимодальности, о которой говорят шизики, или перекодировки в токены. Отточенная связка ллм + дит, со специфичным формированием кондишнов и управлением как с контролнетом (даже более продвинутым). Реализовать это можно от "топорно и колхозно" с применением любой ллм, которая способна делать маски (большинство современных мультимодалок) путем функционального вызова диффузии по написанному и маске, до "хорошо и гладко", когда ллм будет уже более близко и тонко управлять дит без перевода в обычные токены и использования стандартных средств. > всем некстгенам некстген по возможностям Довольно относительно. В одних случаях сказать "отбеливай мне гроида" легче, чем писать промты и выделять его. Или затребовать снять штаны тяночке, такое очень удобно при ограниченном управлении, например голосом по телефону или параллельно с какой-то другой работой чтобы меньше отвлекаться. В других замучаешься описывать что конкретно тебе нужно и все равно не получишь, потому что восприятие этих команд сильно ограничено. При ближайшем рассмотрении это автоматизация простых кейсов, которые работали еще в эпоху сд1.5 с привлечением более продвинутых генеративных моделей. > и сразу все усилия в файнтьюн её пустить Задача неподъемная энтузиастами сходу. Потребуется сначала иметь хорошую диффузионную модель, потом обучить мультимодалку распознавать нужные вещи на анимушных пикчах и релейтед задачам, и далее уже работать со всей системой. Запустить полноценно смогут единицы с профессиональными карточками или ригами из нескольких. Работать будет небыстро. И главное - наигравшись забросят и вернуться к традиционным инструментам генерации. Тут бы хотябы первый пункт как-то сделать.
>>1112268 > на токенах и работает Чтобы понять почему такой подход мертвый, нужно просто посмотреть количество информации в типичном латенте хотябы того же sdxl и прикинуть сколько токенов на изображение потребуется. Если копнуть глубже - сравнить механизмы внимания и сам принцип поэтапного создания изображения. Потом если не забуду найду ту штуку, хоть сделано по принципу "это не трудно - это долго", вещь прорывная и много проблем по пути решили, заодно покритиковав сд3.
>>1111712 >где на любом сиде по промпту выдает абсолютно одинаковый ракурс/позу А всего то надо было 'pose' в промпт добавить. И были бы у тебя и сидящия вангёрлы, и стоящие, и в фас, и в профиль. А уж если с аспект ратио поиграться... Понимаю, не смог. Бывает.
Но вообще, чел. У тебя какие-то странные претензии. Запускай без промпта генерацию тогда, чо. Отдайся на волю нейронки, и надейся, что будет заебись нет. Глупо ждать, что сеть тебе сделает что-то хорошее, если ты ей инструкций не дал.
>>1112308 > Чтобы понять почему такой подход мертвый Буквально опении, цукерберг (люмина - это доработка хамелеона от его ресерчеров) и гугл, судя по косвенным признакам так делают, не думаю, что это мертвый подход.
> прикинуть сколько токенов на изображение потребуется Не много. Вот как демонстрация, гемини 2.0 со своей генераций изображений. В контексте две картинки примерно 1024 на 768 - это всего 566 токенов.
> хоть сделано по принципу "это не трудно - это долго" Не знаю, звучит слишком сложным подходом, против bitter lesson'а идёт.
>>1112354 Хотя, конечно, про гугловую модель какой-то информации нет на тему того, как там такие трюки работают. Но если посталкерить ресерчеров из дипмайнда, то они тоже про стандартный подход с ллм + vqvae писали, насколько помню.
>>1112354 > судя по косвенным признакам так делают Каким признакам? Ты прошлый пост не читал? > В контексте две картинки примерно 1024 на 768 - это всего 566 токенов В контексте только одна и это вполне дефолтное значение для той же геммы после прохождения пикчи через визуальный энкодер и доп нейронку в токены.Там есть только смысловая информация и некоторое ее представление. Этого достаточно чтобы понять что находится на пикче, создать маску для объекта и сделать предварительный/финальный кондишн для дита, который будет вызван тут же.
Для генерации или обработки пикчи нужно полное представление ее попиксельно в виде латента. При 4х канальном вае со сжатием х8 на мегапиксель это выйдет 16384 х4 фп16 значений. Хороший размер словаря у ллмки - 64к, почти те самые 16 бит (на самом деле вычитается много служебных токенов, но этим пренебрежем), итого чтобы сгенерировать информационный эквивалент попиксельного латента в 4х-канальном вае, нужно предсказать 65к токенов. Дипсику с его ризонингом и не снилось, лол. Разумеется это полный пиздец, поэтому в ублюдстве где идет попиксельное представление пикчи в токены и обратно используется куда более жесткое сжатие, условно эквивалентное энкодеру не в 8 а в 12-16раз меньше и в 2 канала, и всеравно на пикчу выходят монструозные десятки тосяч токенов. Требуется монструозная модель автоэнкодера, чтобы это не выглядело как полнейшая мерзость (плохо помогает) и ни о какой точной работе или тем более генерации текста речи не может идти.
Если же мы отходим от подробного визуального представления пикчи в сторону смыслового для сокращения токенов - мы получаем ту самую систему с визуальным энкодером для выхода и дитом для выхода, только с дополнительными средствами контроля на случае манипуляций с готовым изображением. >>1112378 Ну конечно, тяжелой моделью буквально генерируют информацию по одному байту, а потом прогоняют через модель супер-расшакаливатель. Или из 500 токенов реконструируют исходную пикчу почти попиксельно.
>>1112423 > В контексте только одна и это вполне дефолтное значение для той же геммы после прохождения пикчи через визуальный энкодер и доп нейронку в токены. Ну мы не про гемму, а про гемини полноценный говорим.
> требуется монструозная модель автоэнкодера, чтобы это не выглядело как полнейшая мерзость (плохо помогает) Если ты посмотришь как выглядят генерации у той же гемини - то они полнейшая мерзость с точки зрения мелких деталях, буквально турбошакалы.
> Каким признакам? Ты прошлый пост не читал? По признаком того, какие о чем статьи пишут команды около топовых лаб и какие ебанутые намеки дают люди из TPOT тусовки около опении.
> Этого достаточно чтобы понять что находится на пикче, создать маску для объекта и сделать предварительный/финальный кондишн для дита, который будет вызван тут же. Выглядит вообще не элегантным подходом, тренировать такое - это ещё то приключение будет по сравнению с наивным способом.
> Хороший размер словаря у ллмки - 64к, > и всеравно на пикчу выходят монструозные десятки тосяч токенов Да у нынешних топовых ллм словари больше, у той же геммы - 262144 токена. И ничто не мешает хитрить и работать не c discrete токенами под это, а с continuous токенами, где это уже вообще проблемой не будет. Посмотри свежие статьи на тему, их много пишут сейчас.
>>1112509 > Ну мы не про гемму, а про гемини полноценный говорим. В чем разница, там тот же подход. Уже само число токенов подтверждает мою позицию и опровергает твою. > буквально турбошакалы Не настолько ужасно как выглядит треш из токенов. Попробуй запусти, веса в открытом доступе. Гемма в большинстве случаев вообще передает участки изображения без потерь, если ставятся задача инпеинта. > По признаком того, какие о чем статьи пишут команды около топовых лаб Спгс без наличия академических знаний но с сильной верой очень вреден. Какбы уже после употребления > против bitter lesson'а идёт как в этом контексте, так и в качестве самого примера, уровень понятен. > Выглядит вообще не элегантным подходом Наоборот, естественно, элегантно и эффективно. Классическая схема энкодер-ллм-декодер, просто с расширенными опциями управления декодером и возможностью байпаса пикчи на его вход вместо инициализации шума.
Подход с токенами предполагает глобальную и кардинальную перетренировку большой ллм с сохранением как оригинального перфоманса, так и достижения высокой эффективности "генерации". Задача такой генерации сама по себе переусложнена. Если дит видит все текущее состояние и предсказывают переход к следующему, то здесь придется сразу почти финалить малую часть на основе уже готового. Не просто так все опубликованные "ллм генераторы" перформят на уровне далли 2, а ллм часть там как первая ллама или хуже. Также к ним и не существует файнтюнов или даже адаптеров из-за сложности такой тренировки. Но главная беда - колоссальная неэффективность. Цикл расчета одного токена по вычислительным затратам сравним с итерацией небольшого дит. Но если в первом ты используешь весь полученный тензор и сходимость достигается уже за единицы итераций, то с токенами выкидываешь все кроме одного выбранного и повторяешь тысячи-десятки тысяч раз. Можно ужать сильнее, увеличить словарь, еще что-то подкрутить, но это ускорение лишь в разы, которым не компенсировать отставание на несколько порядков, и чревато кучей проблем. Более того, сейчас даже с задачах генерации текста на горизонте замаячило использование подхода постепенного семплинга неких логических мнемо-цепочек с последующей их декодировкой в текст, вместо постепенного предсказания токенов.
Как бы не хотелось верить в романтику (буквально стимпанк), или топать ножкой защищая придуманный манямир, от суровой реальности с погоней за эффективностью не убежишь.
>>1112216 >Что они трясутся за этот "разговорный язык", хоть кому-то не пофиг на это? Если модель не окажется популярной у интеллектуального большинства, то модель не будет такой вариативной и богатой. Другое дело, что это большинство даже с поисковиком не общается разговорным языком и вырабатывает сокращённый диалект специально для него.
>>1112338 Ты ваще понимаешь о чем я говорю? Да и вроде адепты ваикала рассказывают что там легче получать хорошие пикчи с минимумом усилий? masterpiece, best quality, newest, highres, 2024, 2023, 1girl, solo, on stomach, from above, crossed legs, on back, hatsune miku, looking to the side, На ВАИкале 4 из 4 поломанные. 1 даже промпту не следует. 2 пикча нуб. 3-4 пикча masterpiece, best quality, newest, highres, 2024, 2023, 1girl, solo, hatsune miku, from below, skirt lift, out-of-frame censoring, no panties, naughty face, implied sex, pov, У ваикала 3 абсолютно одинаковые картинки без вариативности. 1 отличается тем что промпту не следует
>>1110973 >Кто решил, что сделать подобный UI, это хорошая идея. Не могу сказать, что фордж какой-то особо удобный или интуитивный, но это же совсем пиздец. В фордже для того же самого тебе придётся подходить к пекарне время от времени и ручками всё перелопачивать, а тут по сути запрограммирован комбайн по перебору разных вариантов.
>>1112669 >on stomach, >on back, Ну это проеб, бро. Эпичных таких размеров проеб. Гигапроеб, я б даже сказал. И вот такие они все, хейтеры "ваи-кала". >3-4 пикча Кроме стилистики разницы не вижу. Юбки везде по-разному подняты, позиция рук разная, в остальном - обе модели следуют промпту.
>>1112562 > Уже само число токенов подтверждает мою позицию и опровергает твою. Посмотри свежие статьи, да даже из древних статей - за прошлое лето есть TiTok, там 256 токенов на 512x512, что вполне близко к указанному результату. (С fid'ом хуже чем у sdxl vae, но за то же лето есть лламаген чуть более жирный по токенам, но с fid'ом лучше)
> Не настолько ужасно как выглядит треш из токенов. Ты видел насколько ужасно гемини шакалит? Ты закинь туда что-то для примера, попроси вывести без изменений, потом сравни с тем что вае того же флукса (и даже сдхл) сделает на этой же картинке.
> Спгс без наличия академических знаний но с сильной верой очень вреден. Пока топовые лабы не публикуют статьи, это всё что остается.
> как в этом контексте, так и в качестве самого примера, уровень понятен. Речь о том тренировка описанного комбайна с регионами, сегментацией, масками - это будет прям сложно со всех точек зрения, в отличие от, того чтобы взять более-менее эффективную схему токенизации и дальше не включая ни одной клетки мозга пойти тренировать ллмку.
> Цикл расчета одного токена по вычислительным затратам сравним с итерацией небольшого дит. У тебя ллм даже умеренно большие - это сотни токенов в секунду, если есть эффективная схема токенизации, то проблемы тут вообще не видно. А даже мелкие диты - они не сказать, чтобы очень быстрые в реальных условиях.
> Более того, сейчас даже с задачах генерации текста на горизонте замаячило использование подхода постепенного семплинга неких логических мнемо-цепочек с последующей их декодировкой в текст, вместо постепенного предсказания токенов. Но имеет фиксированную длину контекста при самплинге, и, оно не сказать, чтобы быстро работает.
>>1112953 7,но дело в вае было, похоже, но энивей какая-то хуйня выходит >>1112957 как раз вот скачал с civitai и тогда сразу вопрос, есть ли смысл в refiner?
>>1112923 было принято волевое решение сразу на люстру перейти, будто выглядит получше XL, врам хватает, там ведь те же принципы, что и в 1.5? эмбеддинги, лоры и всё прочее? я просто обезьяна, которая по гайдам кнопки жмёт
>>1112975 Принципы те же. Но модели не совместимы. Некоторые лоры от XL или поня на люстромоделях и их файнтюнах/дотренах/миксах могут завестисть. А могут и нет. За эмбединги ничего не скажу, не юзал.
>>1112939 > там 256 токенов на 512x512 Это кондишн для генерации или да ужаса всратое шакалище если пытаться именно кодировать с возможностью восстановления квази - попиксельно. > Ты видел насколько ужасно гемини шакалит Она шакалит прежде всего если закидывать туда хайрез, или когда плохо понимает запрос и случается полная перерисовка картинки. А так сохраняет мелкие детали не хуже 4-хканального вае. > Пока топовые лабы не публикуют статьи Когда не можешь полностью понять содержимое тематики но очень одержим романтичной идеей - подмечаешь только то что хочется и делаешь неверные трактовки. > это будет прям сложно со всех точек зрения Это необходимо, это делится по частям и это гораздо проще чем натягивание крупной ллм на глобус для аналогичной задачи и тренировки огромного мощного автоэнкодера. Реально ознакомился бы с темой, там vqvae размером больше юнета xl, и всеравно говнище. > более-менее эффективную схему токенизации Ужасно неэффективную если кодировать представление пиксельного пространства. > ллм даже умеренно большие - это сотни токенов в секунду Сотни будут на паре десятков активных параметров и самом топовом железе, тогда как на инфиренс стараются сбагрить уже старье. И на том же железе дит будет крутиться также не менее быстро. > в реальных условиях Как раз в реальных они и быстры, генерация даже на сд3.5 лардж будет быстрее чем средний ответ нормальной ллм. > Но имеет фиксированную длину контекста при самплинге, и, оно не сказать, чтобы быстро работает. Потому пока и не стало основным, но имеет перспективы.
Хоть бы аргументов кроме "это ну суперхуево а всего лишь ужасно если правильно извернуться" или "я так трактую и чувствую", ну камон. Всю эту кухню даже не нюхал, а просто полюбил идею "заставить ллм видеть все напрямую", которая для нормисов выглядит привлекательно, но в реальности с текущими моделями эквивалентна ректальному питанию и утолению жажды.
>>1112999 Юзай рекомендованные настройки твоей модели, там где качал они написаны все. Сгенерил - апскейл х 1.5 хайрезфиксом, настройки по вкусу или опять же рекомендованные. Лора на стиль по вкусу. Персонажей из коробки знает. Эмбединги не нужны, только рекомендованный негатив можно сунуть
>>1113136 >Она шакалит прежде всего если закидывать туда хайрез, или когда плохо понимает запрос и случается полная перерисовка картинки. А так сохраняет мелкие детали не хуже 4-хканального вае. Я буквально только что сравивал сразу закидывая мелкие разрешения - нифига подобного, мелкие детали чекни, оно их теряет хуже хл'ого вае. Просто открой ai studio их, скинь туда фотку с мелкими деталями типа листьев на фоне. Ещё и цвета ломает, вот пример, обрати внимания на верхнюю часть тории.
> Реально ознакомился бы с темой, там vqvae размером больше юнета xl, и всеравно говнище. Ок, буквально тот же TiTok - там версии от 22M до 307M параметров, где это больше юнета xl? У вариантов с fid лучше sdxl vae примерно такие же размеры (вон, у того же лламагена).
> Как раз в реальных они и быстры, генерация даже на сд3.5 лардж будет быстрее чем средний ответ нормальной ллм. Буквально, вон, 4о - 80 ток в секунду стабильно. гемини флэш - 200 ток в секунду.
>>1112965 > но энивей какая-то хуйня выходит > 424x426 Олдфаг-сан, вы для муравьёв генерите? SDXL генерит адекватно на разрешении 10242 и позволяет хайрез фиксы в пропорции не больше 150%.
>>1112999 >а может кто подсказать какие-нибудь лоры хорошие или эмбеддинги на качество? как в 1.5 был эдд_детайлер и прочее У люстры тоже есть детализаторы, а также всякие стабилизаторы, лоры на стиль художника, контроль освещения, слайдеры размера сосков и тому подобное. Обычно люстромиксы выдают хороший результат с минимумом лор, а сами лоры часто заменяются промптом с токенами качества.
dmd2 - полезная лора, потому что позволяет сделать быстрый набросок там, где не требуется тонкая настройка отрицательным промптом.
>>1113244 > >какие-нибудь лоры хорошие > dmd2 Шиз не упустит случая прорекламировать свое 3д-шизодобро. Дедотред там =====> Уже пора банить за упоминание дмд итт. Оно и с реалистиком-то не может, вариативность и качество в задницу уходят, с 2д вообще караул.
>>1113368 Ну конечно, кто ещё не упустит случая прокомментировать мой пост с безвариативным дмд-нейрослопом на ВАИ, кто ещё подарит you-шку? Конечно, ДОРОГОЙ БРАТ дмдхейтер, всегда можно рассчитывать на него. Держи цундере в бронебикини в знак признательности.
>>1112359 >>1112373 Хорошие >>1113236 Этот срачспор сделал меня захотеть погенерить мемчики, спасибо. Лучше расскажи как заставить наи4 перестать быть говном, ты же вроде экспертом в этом был. >>1113244 Ничесе вареник пати
>>1110943 Крч, потестил твоего нуба подольше, хуета какая-то. Да, теги персонажей есть, но опять таки если картинок по ним не прям дохуя ( условно меньше 200), то получается максмально не точно и на персонажа похоже только отдаленно, так что лора все равно нужна
>>1112669 Нет смысла так активно доказывать что-то столь убежденным, для них наоборот то, что ты называешь отсутствием вариативности - это так желаемая штабильность. Нравятся и пусть урчат, как по мне это вообще треш полный с точки зрения ощущений от генов и живет своей жизнью, а не делает то что ты промтишь. Хотя если промтить простого 1герла в разных позах без форшотенингов или чего-то особого то прокатит. >>1112701 > запрограммирован комбайн по перебору разных вариантов Это то что у белых людей называется гриды? А клифхарт хорошенкая, давай еще генери >>1113252 Что за стили? >>1113626 Запромтить атрибуты чара а не только надеяться на оверфит его тега не пробовал? У нуба все норм со знаниями персонажей, исключая совсем редких или свежевышедших. Отсечка там оче низкая была и скейлом вытягивали. >>1113605 Расшакал инб4 еще более шакально
>>1113676 Да, тут точно фейл вышел. Квопа оче популярна, но на данбуре с ней 36 пикч, и результат закономерен. Вот для чего нужны разнообразные и тщательно курируемые датасеты.
>>1113424 Эх, хотел пожаловаться, что это небось ускорялка горизонт поломала у тебя на картинке, а потом запустил нуба без ускорялки и даже как-то расстроился, ещё как горизонт ломает для dutch angle картинок.
>>1113605 > сделал меня захотеть погенерить мемчики, спасибо. Мемы хороши, одобряю.
> Лучше расскажи как заставить наи4 перестать быть говном Скинь с метадатой, посмотрю что и как, четверка сильно от конкретных стилей зависит в плане поведения. Да и вообще сильно по поведению от предыдущей отличается.
А так общие советы (как минимум всё свое я так сейчас делаю) после их апдейта - включить legacy conditioning, cfg ~5-6 (variety+ - зависит от художника, сами наи рекомендуют кфг ещё ниже, но мне не особо понравилось так), euler a + karras. Хайрез фикс в ~0.41. Абузить инпеинт как обычно можно и нужно, раз уж у них хорошая инпеинт модель.
Если нужен прям стандартный современный анимешный стиль - то можно выключить legacy conditioning и оставить их негативы, будет стабильнее.
Иначе: негативы, если стиль не более-менее стандартный лучше заменить на что-нибудь минимальное в духе ai-generated, ai-assisted, bad hands, anatomy error, off-topic, status:deleted, для любых популярных и качественных художников можно вообще без них. Квалити теги - тоже в зависимости от художника, кому-то помогают, кому-то нет.
Промптить - если лень их рег промпты использовать, то для сложных сцен часто работают трюки с явным разделением деталей в промпте. В духе "In foreground:..., In background: ...., Left side of the image:...., Right side of the image:..." и т.п.
Ещё из трюков, некоторые хотелки проще даются с e621 тегами + fur dataset поставить в начале промпта, но тогда надо негативы править, или везде явно расписывать human и т.п. Это может повлиять на стиль как в положительную, так и в негативную сторону, тоже от художника зависит, некоторых прям хорошо стабилизирует.
>>1113632 Есть, но я туда перестал постить. Делюсь, если спросят. Чтобы спрашивали, а не молча копировали - тру метаданные из вебп. В этой картинке оставил, пользуйся. Если ты лапшеед, могу в пнг и на литтербокс. Рисоваки в остальных картинках выше - очевидный piromizu и неочевидная kohinata hoshimi, алсо "semi-realistic" вместо "аниме скринкап". Промпт склеен из двух других, поэтому такой длинный и мусорный.
>>1113815 Ещё добавлю - что советы про legacy conditioning, variety+ и негативы - это прям субъективщина, кому-то сильно больше нравится как модель себя ведет как раз с ним выключенным и со стандартными негативами, это надо пробовать.
>>1113815 > четверка сильно от конкретных стилей зависит в плане поведения Выглядит страшнее ядерной войны на большинстве комбинаций что хороши или интересны в в3 или локалках. Просто хочешь повторить то же, что стабильно и легко делается на локалке, но в большинстве случаев идет крайне странная реакция на стили с частичным игнором и плохое следование промту с использованием их регионалки https://litter.catbox.moe/neld56.png протечки https://litter.catbox.moe/c5645x.png когда срандомило и отдаленно попало в стиль то распидарасило и опять игнорит ключевой тег https://litter.catbox.moe/bumfxz.png когда уже заебался роллить - оно попало в промт https://litter.catbox.moe/y6wdvf.png но выглядит отвратительно. Конкретно в этих не спорю, у Флуфсмера припезднутый стиль, но он интересен и остальные призваны его разбавить. Пикчи сверху рефернсом, это лоуэфорт генерации (исключая текст).
Если там еще поверх этого пытаться делать спичбаблы (даже убрав негатив про текст) то можно просто сдохнуть, особенно когда их дудосят азиаты и каждый пик делается по 20-30 секунд.
Как вы глаза чините? Или у ваших моделей нет проблем с глазами, когда нужно что-то необычное? Мне если модель насрала в глаза, то всё, она уже не исправит картинку, хз, дело в модели конкретной или всегда так.
Я знаю, что тут еще косяки по типу пальцев, но это более менее фиксится, а вот от глаз инпейнт не помогает.
>>1114147 Фигасе её на этом стиле ломает, я вначале сделал только с одним художником и с чуть шизо-промтом. Надеюсь наи альфа-канал метадата переживет, смотри последнюю приложенную.
Сейчас попробую разумно смиксовать, кантоку тут не самый удачный, его и самого может ломать.
>>1114242 Да, метадата пережила. Я тут ничего не правил, никакого фокусед инпеинта или хайреза не делал, чистые генерации. Промпт скорее всего не идеальный и там есть странные моменты, т.е. дичь про фотореалистичный бэкграунд и дальше - тут лишь чуть-чуть помогает, хотя некоторых прям сильно бустит.
>>1114242 Да там на самом деле почти любую комбинацию как не дерни - получается залупа а не то чего ждешь. Здесь просто совпало что наиболее явно демонстрируется, и артист сам на себя не похож, китайская копия. Вот и выходит подбирай что-то что выглядит не сильно мерзко и не рыпайся. На "лучшей" сетке. За денежку. По 2 пикчи в минуту если генеришь не поздно вечером по нашему поясу. Энкодер там тоже далеко не такой хороший и многое не понимает. >>1114248 Спасибо что попердолился. Хз, пока не могу сделать других выводов кроме как невозможности полноценно использовать стилизацию там. Ну и хуй с ним, нужна все равно для другого.
>>1114255 > невозможности полноценно использовать стилизацию там Ну они сами признали, что миксы плохо работают, так что есть такое.
> Да там на самом деле почти любую комбинацию как не дерни - получается залупа а не то чего ждешь. Я старые свои стили с в3 воссоздал ради интереса (см. первый пик, я с таким много постил год назад), но да, там надо играться с [[[[[...]]]]] и крутить гайденс рескейл. А, ещё мега важно - всегда надо год указывать. Но и то - оно менее стабильно чем на в3 будет. Так что если нужно миксовать - то пока всё сложно, может vibe transfer эту проблему решит, посмотрим.
> артист сам на себя не похож, китайская копия. 80 артов на бурах, причём они сложные достаточно по стилю, ничего удивительного, это ниже границы которой оно стабильно и хорошо стиль держит.
> На "лучшей" сетке. За денежку. Ну во всем кроме стилизации - она SOTA с анимешной точки зрения. И то, некоторых художников она воспроизводит отлично, вон кантоку, если правильно готовить, куда лучше любых нубов выходит.
> По 2 пикчи в минуту если генеришь не поздно вечером по нашему поясу. Я как-то мерял, стабильно в секунд 10 укладывалось, за исключением каких-то редких случаев.
>>1114366 > надо играться с [[[[[...]]]]] и крутить гайденс рескейл И рулеточку покрутить потому что стили штормит. Квинтесенция кактуса для поедания. > ничего удивительного, это ниже границы которой оно стабильно и хорошо стиль держит Врунишка, стыдно таким быть. > она SOTA с анимешной точки зрения Херня, ведь на флюксе есть возможность воспроизводства любых анимушных персонажей с помощью промта. Даже не знаю кто это заявлял. После такого - херня и не впечатляет. А если серьезно, на содержательный натуртекст оно реагирует гораздо хуже ожиданий или того же флюкса. С тегами - шаг назад относительно в3, легчайше может заигнорить целые куски промта. Нужно извращаться и накидывать шизопромт чтобы оно как-то работало. Возможно, здесь еще проявляется эффект игнорирования части токенов возде границ чанков как в в3, если в в4 используются клипы одновременно с т5. В итоге из фич остается только возможность описания взаимодействий и индивидуальных атрибутов, но работает оно хуже регионалки в локальных моделях. И еще отдельные не(до)представленные на бурах концепты, всеравно требующие описания и кучи роллов. Не просто так в4 хейтят даже самые лояльные пользователи, которые превозносили в3 не смотря на ее недостатки и готовы схавать что угодно из-за отсутствия альтернатив. Это уже о чем-то говорит. > свои стили с в3 воссоздал ради интереса Asymmetrical docking куда пропал? > стабильно в секунд 10 укладывалось В удачное время там до 5 секунд, если ты ночной житель и непривередливый то пойдет, просто кнопку заебешься тыкать. Днем - пол минуты даже для в3 это норма, если не улетит в таймаут.
>>1114161 Смотря какие глаза нужны. У меня из необычного есть только персонаж со зрачками звёздами, это нейронка достаточно успешно рисует. Нужен промпт symbol shaped pupils или star shaped pupils. Затем хайрез фикс и инпейнт на глаза и лицо. Причем чаще всего даже лора на конкретного персонажа не нужна, но можно и с ней.
>>1114337 По беличьим хвостикам. Ты ж предлагаешь эту серию туда залить, я так понимаю? >>1114360 Во-первых, это не нуб, а kawaij 1.0, люстромикс (можно и WAI взять, а сейчас вот вообще анимагине4+). Во-вторых, ускоряко-лора дмд2 (причём 16 шагов для неё это уже серьёзный оверкилл) плюс вспомогательные детайлеры. В-третьих, хороший сэмплер.
>>1114161 Кропни лицо этого чувака и посчитай, сколько пикселов на него приходится.
Чего ты ждешь? Что тебе модель в почтовую марку сверх-детализации навалит? Это так не работает.
Увеличивай разрешение. До 1600. До 2048. До 4096. Вырезай отдельно фрагмент с лицом. Делай инпэинт.
Когда у тебя только лицо перса будет в 1024 пикселов умещаться а лучше в 1600, с последюущим даунскейлом - вот тогда будут тебе хорошие и детальные глаза.
Это >>1114461- херня, смысла без увеличения разрешения все равно не имеет.
>>1114434 > И рулеточку покрутить потому что стили штормит. Квинтесенция кактуса для поедания. Как раз трюки с [...] и гайденс рескейлом позволяют стабилизировать более-менее, хуже чем у в3 было, но сойдет.
> Asymmetrical docking куда пропал? Это я переписываю промпт и теряю букву, бывает.
> А если серьезно, на содержательный натуртекст оно реагирует гораздо хуже ожиданий или того же флюкса. Зависит от, есть знания которых просто выжжены у анимешных моделей (типа техники, архитектуры, географии, интерьеров), и там, да, хуже. На чисто композиционных промптах (а-ля те же кубы или расставление персонажей по сцене) - оно вполне сравнимо. То есть, на это я пока особо жаловаться не могу, все что я хочу промптить - промптится более-менее успешно.
> оно хуже регионалки в локальных моделях Да я регионалку у новелов не юзаю, если честно, за исключением совсем странных случаев. На двух-трех персонажей натур текста хватает. На нубе юзаю часто не ради персонажей, а ради композиции в целом, некоторые вещи там без этого невозможно сделать.
> Не просто так в4 хейтят даже самые лояльные пользователи, Ну за миксы стилей и за то что вайб трансфер сразу не выпустили - да. А в остальном, знаю я каких лояльных пользователей ты имеешь в виду. В хдг это - десять троллей, хейтер-семён и ещё любитель черных хуев расстроенный, что его любимый слоп-стиль не работает. И в дискорде у новелов набегали рандомные азиаты с промптами уровня "шизофазия без знаков препинания", кфг в 20 без рескейла и ругались, что ничего не работает, тоже лояльные пользователи.
Привет, всем! Мы достигли ещё одной невероятной вехи – и это всё благодаря вам! Без вас Pony просто не существовал бы, и мы очень ценим, что вы с нами. У нас есть новости, но сначала – давайте праздновать! 25 тысяч – это серьёзное число, и для меня это отличная возможность оглянуться назад. Так много версий Pony, столько классных новых людей! Спасибо вам, что вы здесь – и вперёд к следующим 25K!
🔥 Превью V7 теперь доступны подписчикам 🔥
Долгожданный момент настал – мы близки к релизу! Мы завершили обучение первого e2e-чекпоинта, осталось немного доработать детали, но релиз уже на горизонте.
✅ Заходите в #v7-preview-images, чтобы посмотреть примеры изображений ✅ Обсуждайте V7 в #v7-general-chat-temp
Если вы хотите получить ранний доступ, оформите подписку! Все текущие подписчики уже могут тестировать ранние версии модели через бота. Мы всё ещё исследуем возможности модели, некоторые функции в процессе доработки, но если вам не терпится попробовать – сейчас ваш шанс!
🚀 Что нового в V7 по сравнению с V6? 🚀
✅ Разрешение до 1.5K пикселей ✅ Улучшенная генерация тёмных и светлых изображений ✅ Сильное понимание промптов: улучшено описание объектов, фонов и расположения ✅ Остаётся без цензуры + улучшены NSFW-аннотации ✅ Лучшая анатомия рук и ног, меньше артефактов ✅ Улучшенное управление стилями (описание на естественном языке, кластеризация) ✅ Оптимизация VRAM – можно запускать на 2bit GGUF (но 4bit лучше), у нас инференс на 8bit без потери качества ✅ Поддержка новых направлений: V7 делает отличные аниме-стили и достойный реализм ✅ Инструменты: Colab для аннотаций, эстетический классификатор, документация по промптингу
🔧 Что ещё нужно доработать? 🔧
🔹 LoRA-инфраструктура – есть 2 совместимых тренера, но нужна документация 🔹 Контроль стиля – пока контрастность иногда выходит за рамки 🔹 Поддержка ControlNet – улучшенный промптинг делает это менее критичным, но работа идёт 🔹 Скорость – генерация 1.5K-изображений занимает больше минуты на RTX 4090, работаем над ускорением 🔹 Чистка артефактов – V7 лучше справляется с призрачными логотипами/подписями, но финальная доработка ещё впереди
🎨 Обновление бренда и важные анонсы 🎨
Скоро объявим крутые новости, но пока не удивляйтесь изменениям. У нас новый логотип, а название теперь просто Pony V7 – без "Diffusion".
🤝 Новый партнёр: PicLumen 🤝
Рады представить PicLumen – нашего нового официального партнёра для Pony V6, который также предоставит ранний доступ к V7.
✅ Бесплатная генерация для Pony, FLUX.1-schnell и других моделей ✅ Уникальные инструменты, такие как Prompt Magic (готовые шаблоны стилей) и Describe Image (автоматический промптинг из изображения) ✅ Качественный веб-интерфейс для генерации изображений
🔄 CandyHorn.ai – новый дом для NSFW-контента 🔄
Мы переводим сервер в более SFW-дружественный формат, но не хотим мешать вашему творчеству. Наши друзья из CandyHorn займутся NSFW-контентом, так что вам, возможно, придётся присоединиться к их Discord-серверу.
✅ Ваши подписки и доступы останутся в силе ✅ Больше настроек приватности и гибкость генераций ✅ Генерации по умолчанию станут приватными, но с возможностью публикации
>>1112669 не вкурил доеба до нубаваи, как и мистической вариативности, когда модель в рамках промта дает отличный друг от друга результат, это оказывается не такая какая надо вариативность хз че хотел, чтоб тебе модель выдала при промте from above вид сбоку чтоли... что запромтил то и получил, убери тег камеры получишь больше вариативности Поломок кроме стандартных разъебов нейронок не заметил
>>1113626 ну я говорил что он в целом получше генерит (но это опять же мое субъективное и по моим тестам) и база у него шире, но не то что он знает любого перса или любой стиль, я сам лоры себе делаю на стили мангак которых врятли когда добавят в датасет, как и некоторых персов тоже нету, тут уж что имеем так сказать
>>1114670 Если маршрут 410 то известно куда сходить с рельс на строгинском мосту >>1114687 Проиграл с разнообразия. Но больше бросается насколько мерзко выглядит ваи-слоп в комбинации с базовой поджаренность нуба (или что ты там намешал).
>>1114705 >модель в рамках промта дает отличный друг от друга результат, это оказывается не такая какая надо вариативность
Проиграл с пустого кукарека про опять не такое какое надо разнообразие, хоть бы пояснил для незнающих, может прозрею и осознаю истину какую великую. Это вообще-то yabuki, но ладно, так то что тулавру, что акаши выглядят как гаремный этти слоп, тут не поспоришь :D
>мерзко выглядит ваи-слоп в комбинации с базовой поджаренность нуба (или что ты там намешал)
Ну так хуль, тащи свой не мерзко выглядящий не ваи-слоп шедевр, хоть наслажусь топовой генерацией, а то все смотрю на свой слоп и страдаю, спасешь человека так сказать.
>>1114743 > не такое какое надо разнообразие Действительно ерунда какая-то, вот держи, починил. > не мерзко выглядящий Вот эти лисички, пара постов над этим, 3 поста ниже.
>>1113626 Интересно, почему за основу берут данбуру, а не скажем санкаку, когда на последнем картинок больше на персонажей. Зачастую, в разы больше. И там больше всяких обскурных артов, или старых картинок.
не убедил, промт взял от сюда>>1112669 модель следует промту - следует арты поломаны - нет вариативность есть в рамках промта, в позе, угле камеры, в других деталях - есть без хейта братишь, прост считаю что за доеб на пустом месте.
промта на выражение лица нет, модель отталкивается от глаз в сторону. Добавь промп на выражение лица и будет куксится в рамках него уже, тот же пример ниже с юбкой вверх, там промт на лицо хоть есть и уже выражение меняется в рамках него (на одном даже палец к лицу поднесла, и еще naughty face тянет сердечки в глаза)
>Вот эти лисички ну так лисы тоже ж на ваикале сделаны, прост я там накидывал промта чтоб мне нравилось. взрывно-цветасто-абстрактные гены не считаю аргументом в этом случае, так как разные категории. Ну тип мы тут генерим тянку на диване, ктото скажет что тип тянка ваша хуита и слоп и принесет так какую нибуть хуиту взрывную с кучей эффектов. Ну и как бы сказать и хуль, я такое тоже могу напромтить и срать этим на каждую голую жопу на кровати говоря что хуита и слоп. Арты то разных так сказать категорий. Может ктото просто хотел тянку с жопой на кровати. И если сама генерация чистая и красивая то считаю уже успех
>>1114869 > не убедил Че там убеждать, идентичная поза до мелочей, идентичный ракурс, одинаковое положение волос, одинаковый аутистичный фейс, отстраненный взгляд ровно под тем же углом. Один раз зеркально отразило со 100% сохранением всего, в остальном разница в 2.5 вариантах положения рук и степени поломанности дивана. В промте ничего конкретного про позу, костюм, конкретный ракурс, окружение, огромный простор для изменений, а тут буквально фабрикация клонов. Этот эффект будет постоянно мешать если захочешь отступить от дефолтного дженерика и вносить свой вклад. Так-то на ваши срачи похуй, но вон та херня - такой ор Еще интересно как ты добился вот настолько ультимативной манифестации такого эффекта, ведь ваи кал со стилями плох не настолько (пик3). Жесточайший алайнмент на дефолтный интерьер и 3.5 позы с одинаковыми лицами на месте, но не настолько радикально. Или может настолько, просто здесь удачно срандомило > ну так лисы тоже ж на ваикале сделаны Слоповость там не выражена так явно и лисы в отдельном тирлисте. Продолжай их делать, иногда проще приспособиться к чему-то. >>1114912 > как будто жопы это чтото плохое Всмысле, где сказано что жопы - плохо?
>>1114965 >идентичная поза до мелочей ну если зрение минус 8 то наверн, но опять "ваша вариативность не такая какая надо"
>конкретного про позу, конкретный ракурс, ну да from above, crossed legs, on back, looking to the side модель дает что просил с вариациями = хуита и клоны и вообще идентичная поза.
>добился вот настолько ультимативной манифестации
ну тут признаю, наверно моя ошибка при выборе стиля и генерации примеров. я генерю на кфг повыше, и более детально прописываю промт чтобы получить то что мне нужно в том виде в каком задумал. И например в этих так сказать задачах меня устраивает даже небольшая разница в рамках промта. Я ведь получаю что хотел, а не что модель мне вариативно насрала под разными углами и позами и что мне может быть не нужно.
Чуть попустил кфг, стало срать более разным. Может мои негативы еще повлияли... Та и стиль ябуки более слопово выглядит не поспорю. Но тут опять же вопрос в том кто что понимает под вариативностью и что хочет от модели. Каждый может по разному понимать вариативность (разнообразие) в генерации.
>ваши срачи похуй
Та братиш никто и не срался, прост анон притащил какие то разьебаные гены и сказал что ваикал хуево генерит и нет какой то мистической вариативности без нормальной аргументации. Ладно бы там правда было хуево как в средней генерации на пиксиве, но доебы до вариативности, когда она напрямую зависит от промта и кфг хуита. Понизь кфг и будет тебе вариативность. п.с. Проиграл с вариативности 2 пика конеш, но лан в большей мере зависит от промта и кфг, если в выбраном стиле докуя белых фонов, то больший шанс что при генерации модель будет вариативно срать белыми задниками. У меня на одном кфг и промте но в разных стилях, может быть как хуита из дивана, так и нормальная детальная комната например. Но все вкусовщина и субъективность, так что без негатива если что братиш.
>>1115223 >>1114965 > ваикал хуево генерит А что спорить-то? Факт давно известный. Подставить любое название инцест-микса с запеченными лорами. Для этого не надо быть семи пядей во лбу, нужно просто хотя бы немного понимать чем файнтюн отличается от васян-микса.
Сап, нейробояре. Я к вам вкатился с ЛЛМ треда. Так как знаю чуть больше, чем нихуя. То сразу с главного вопроса : FAQ треда - актуальный ? Который https://2ch-ai.gitgud.site/wiki/nai
>>1114682 >Скорость – генерация 1.5K-изображений занимает больше минуты на RTX 4090, работаем над ускорением Ха-ха-ха. Ха-ха. Ха. Кому оно вообще в таком виде понадобится?
Какой промпт для того чтобы персонаж по центру лапал жопы персонажей по бокам, как во всяких нтр картинках? Я пробовал megumin grabbing other girl's asses но получалось что трогают по итогу ее саму, хз че делать
>>1115303 Очень актаульный и хороший, если не совсем дегенерат дальше разберешься, я начинал вообще с версии гайда SD1, когда уже давно была пони в6 (sdxl), но базы навалили все все потом стало понятно.
>>1115351 Двачую, это какая-то садисткая ловушка для нубов, еще и в комбинации с названием модели. Меня, новичка так же поймали. Я уже был готов дропнуть генерацию картинко навсегда, но догадался Хассаку и Ваи попробовать.
>>1115351 > написав промте: > >1girl, standing > он бы выдавал сразу нормальный результат Доска 18+, требует iq!=icq, ты не удовлетворяешь, извини.
>>1115356 > Я уже был готов дропнуть генерацию картинко навсегда, но Очень жаль, что не дропнул. Теперь будет ещё больше генерик слопо-мусора, из-за которого хейтят вообще всё с приставкой "аи". Подумай ещё, может дропнешь?
>>1115303 Актуальный, но не совсем понятный. Говорю как ньюфаг, что вкатился в нейрослоп пару недель назад. Там много всякой терминологии непонятной, и некоторые вещи плохо объяснены, типо инпейнта или контролнета.
>>1115347 Там и до этого пиздёж. >NoobAI-XL - самый популярных файнтьюн аниме-модели Illustrious-XL на момент конца 2024 года Хотя достаточно открыть главную цивитая, чтобы увидеть, что это не так. WAI-NSFW-illustrious- в разы популярней.
Так, я немного не понял за сами модели. Вот есть модель, есть её файнтюн. Тут все как языковыми моделями. Но, блджад, что это тогда ? https://civitai.com/models - это мержи всяких стаблфьюженов ? В графике, в отличи от ЛЛМ не нужно 100500гб ВРАМ чтобы замержить что то вменяемое ?
>>1114613 リス耳 и прочие "рису"-теги. Никто не мешает и свой поставить. >>1114814 Зашёл на эту вашу каку: R-15 - требует логин "ахтунг! матуре контент!", просто банально теги у картинки посмотреть - требует премиум-подписки. Я хуею с этих жлобов. Наверняка там и датасет сграббить нельзя без хакирства. >>1115330 girl sandwich, hand on another's ass попробуй, но вообще тут только роллить до получения нужного либо региональный промпт и контролнеты. >>1115347 Очень жирный. В той части, где "хороший для начинающего".
>>1115434 > Там и до этого пиздёж. > >NoobAI-XL - самый популярных файнтьюн аниме-модели Illustrious-XL на момент конца 2024 года > Хотя достаточно открыть главную цивитая, чтобы увидеть, что это не так. WAI-NSFW-illustrious- в разы популярней. Да, только это не файнтюн, а шитмикс.
>>1115330 Без контролнета, сегментации, референс-картинки с позой, или пост-редактирования - такое будет трудно срандомить. Мужика на задний план - сколько угодно, а вот чтоб только трех девок в данной ситуации - почему-то фиг. Видимо, тэг netorare шибко силен, даже негативами на неполной силе не перебивается. А без него именно такая поза не включается, получается всякое-разное, но не то, что нужно. Ну или я чего-то в промптинге не знаю.
Хотя мужика можно попробовать убрать через тэг yuri. Пятый пикрил как пример. >3girls, grabbing another's ass, grabbing from behind, asymmetrical docking, yuri, size difference, straight-on, sexually suggestive, Но это, скорее, рандом наконец-то тупо сработал и то лица инпэинтить пришлось, плюс Аква шибко мускулистая вышла, как и на четвертой.
Помню еще, как пытался `arm hug` с `arm between breasts` накрутить, так ничего и не вышло. Обнимать - обнимает, но как только второй тэг добавляешь - тоже все нафиг ломается.
>>1115463 >girl sandwich, У этого обычно другой контекст, когда персы по краям "доминируют" над тем, что в центре. Но тоже вариант, последняя картинка.
>>1115223 > ну если зрение минус 8 то наверн Какое нужно зрение чтобы не заметить 4х клонов в том твоем примере, словно сделанных по опенпоз контролнету? Ебало одной вырезаешь, ставишь к остальным и ничего не меняется. С этим у таких миксов большая беда, а на выходе все равно поломанная анатомия получаются. > кто что понимает под вариативностью и что хочет от модели Именно. Нравится - обмазывайся, понимать высокую плату за эфимерную стабильность и принять это, а не устраивать аутотренинг. Или вообще избегать такого для использования в исходной генерации, сразу много для себя откроешь. > Проиграл с вариативности 2 пика конеш В чем там проигрывать? Разные позы, разная одежда, разные ракурсы, разное окружение. При отсутствии их указания на это в том числе будет влиять используемый стиль, что и наблдюдается. Но безальтернативного дивана в желтом ливингруме нигде нет. > когда она напрямую зависит от промта и кфг хуита От cfg зависит прежде всего степень ужаренности и мелочи, нет у него столь сильного влияния на композицию, исключая крайние значения где пикча неузнаваема. >>1115330 2girls, 1boy/1girl, 2boys/3girls/..., girl sandwich, ass grab. Или контролнетом сразу. Если хочешь установить позиции конкретных то потребуется региональный промт или манипуляции. >>1115358 Двачую, митинг слоподелов устроили. Хотя ваи в список добавить можно, с прямым описанием что облегчает промтинг новичков ценой креативности, и для иллюстрации вот эту пару >>1114687>>1114807
>>1115663 >вот эту пару Так это какой-то неправильный вай. Опять поди какой-нибудь в говно лоботомированный педофильский микс юзают. Ну или стиль влияет. Вай (v110) - на пикриле.
>>1115694 Та более рофловая и иллюстративная. А в каком сорте лучшее соотношение клонов и мутантов уже ты подскажешь. Кстати, также забавно что не взорванными получились только пикрелы, в остальных диспропорции, безногим или с одной ногой от карлика. Нуб даже стабильнее будет. Стоит записать что попытки расшевелить подобные миксы приводят к повышенному бадихоррору, с сохранением яркого диванного ливингрума, или это просто скиллишью?
>>1115704 >клонов Чел, в проме буквально Мику. Как, по твоему, модель должна ее рисовать, если не даны дополнительные инструкции?
Ракурс? Меняется. Поза? Меняется. Окружение? Меняется. Причем я специально тебе ловушку подкинул, сделав 12 картинок, чтоб ты начал похожие варианты на более длинных "сериях" выискивать. И ты в эту ловушку с разбегу вляпался, поздравляю. Средний ряд возьми, например. Ну, если б я только этот грид кинул, какой аргумент ты б придумал?
>Нуб даже стабильнее будет. Критичная поломка анатомии - на одной картинке. Но нуб и похлеще >>1107718 → результаты выдает, если его не взнуздать как следует, а дать "покреативить".
Тебе может не нравиться "базовый" стиль, в котором работает модель - но ты же понимаешь хотя на что я тут надеюсь что это чистая вкусовщина?
Если симметрично крутить, то получится, что: >На пикрилах - клоны ряяяяяя! в позы и ракурсы не может! >На пикрилах - биас на черную бездну/красный-желтый диван ряяяяяяяя! разнообразия нет!
>>1115694 >педофильский микс юзают Ой-все, не можешь победить в дискуссии, расчеловечь оппонента или хотя бы навесь ярлыки.
>>1115719 >"базовый" стиль, в котором работает модель - но ты же понимаешь хотя на что я тут надеюсь что это чистая вкусовщина? У модели не должно быть "базового стиля". Но она должна уметь принимать любой из изученных. Но у адептов инцеста все наоборот.
>>1115719 Хуя пичот. Если ты не видишь очевидного и такой поднадусеровый, то и говорить с тобой не о чем, кто-то должен быть фриком. Нужно зафиксировать что пользование щитмиксами также влечет аутизм и поднимает уровень стресса.
>>1115736 >Ой-все, не можешь победить в дискуссии, расчеловечь оппонента или хотя бы навесь ярлыки. А нефиг клонов кидать. Из-за одного не шибко умного развели тут срач, понимаешь.
>У модели не должно быть "базового стиля" Должно.
>Но она должна уметь принимать любой из изученных. Что вай вполне может. Я пока не видел демонстрации обратного или преимущества нуба в этом вопросе. Чтоб прям с чистого нуба взяли случайную выборку, картинок 12, и показали 100% сходимость со стилем какого-нибудь художника.
И не увижу, потому что модель без жесткой инструкции в виде лоры будет неизбежно выдавать флюктуации по самым разным векторам. Не говорю уж о том, что у рисовак стиль меняется от года к году, и чего там в тренировке было - никто не знает. А уж учитывая возможные варианты изготовления самой картинки (разрешение, апскейл, латент/ган/ДАТ), и неизбежное влияние промптов качества... Так что разница между нубом и "мягким" миксом будет в том, что нуб рандомит просто потому, что ему хочется, а у микса - четкий биас в одну сторону. У "жесткого", лоботомированного микса сходимость будет получить значительно сложнее, а то и вообще невозможно.
>Но у адептов инцеста все наоборот. Пуританамстам слова не давали.
>>1115739 По делу то возразить нечего? С картинками, с демонстрацией? Так и запишем.
Я ж буквально те же самые аргументы перечислил, которыми на "щит-миксы" накатывают.
>>1115694 >Так это какой-то неправильный вай. нормальный вай, я к тому же все расписал с примером >>1115223 для всяких шедеврошизов.
>>1115663 Но похоже конструктивно пообщаться со свидетелем вариативных топовых генераций не выйдет, он просто кукарекает попусту без аргументации и игнорит неудобное. >От cfg зависит прежде всего степень ужаренности ага, ты там стейк жаришь, прожарку веллдан тогда давай и картофана запеки еще, степень ужаринности, прикольный наверно параметр, за что отвечает то... >В чем там проигрывать? Разные позы, разная одежда, разные ракурсы, разное окружение. Так я и говорю все посты в духе "Ваша вариативность не такая какая надо вариативность" > Нравится - обмазывайся Так не я агрюсь на каждое упоминание ваи в треде, я только ответил челику который скинул поломанную хуиту и воздухал без аргументации. я тебе дал пример где немного сбавил контроль >>1115223 но ты ж проигнорил, это ж неудобное, но зато черная бездна это у нас вариативность, главное не диван ....
>>1115719 ля светлый голос в темном царстве, спасибо тебе анон
>>1115768 та блин я ж делал по промту как анон выше там, он там воздухал что арты поломанные, я ему нагенерил не поломанные, с нормальной вариативностью в целом. Отличия в артах есть и заметные. Кто ж сука знал что вариантошизы считают вариативностью не чтото осмысленное, а просто когда модель по приколу тебе срет бездной или рандомным столом или полем. Ну заблуждался че поделать...
>>1115744 > По делу то возразить нечего? Когда ты напишешь по делу а не полотно шизы, где клоны и мутанты - хорошо, потому что Мику. Че ты вообще тут забыл, аутизммикс 2 блока ниже. >>1115750 > похоже конструктивно пообщаться со свидетелем вариативных топовых генераций не выйдет Конструктивный диалог это что? Признать очевидные вещи, наличие преимуществ и недостатков - так вроде уже. Ущемляться с фактов, а потом как инфантильный ребенок отстаивать свое право играться как хочется - да играйся, кто запрещает. > я только ответил челику который скинул поломанную хуиту и воздухал без аргументации А я орнул с твоего примера вариативности из копипасты одной пикчи. А потом зачем-то продолжил отвечать, когда стало очевидно что ты сильно предвзят и просто топишь за кумира, а не хочешь что-то обсудить, это была ошибка.
>>1115801 >Когда ты напишешь по делу Картинки где? Демонстрация, примеры где? Ты же понимаешь, что ты себя своей агрессией просто закапываешь, и чем дальше - тем глубже? Люди тут пытаются что-то обсуждать, с демонстрацией, серьезно, а от тебя никакого конструктива. Какой же ты жалкий все-таки.
>>1115347 > Что за жирный тролль это написал? В случае поней, мёрджи были актуальны, поскольку на дефолтных понях нельзя было адекватно управлять стилями за счёт промпта, так как понишиз захешировал всех артистов в своём датасете (чсх тоже самое он сделал и в седьмых понях). Поэтому имело смысл качать стилелоры или мёрджи с каким-то вшитым стилем, приятным на глаз. В эпоху люстры/нуба такой потребности нет - для ленивых, достаточно украсть приятные лично тебе картинки с метой из галереи модели, чтобы получить понравившуюся стилистику. А дальше остаётся только узнать точные никнеймы твоих любимых артистов на бурах и обмазываться гридами, миксуя их.
Конкретно эта рекомендация: > NoobAI-XL обладает хорошим знанием концептов, персонажей и стилей из коробки. Хороший вариант для начинающего.
Была добавлена, когда ещё активно шли срачи на тему пони vs нуб/люстра, а тот же WAI еще так не хайпанул. Ну и нуб действительно проще по сравнению с пони, поскольку в нём не требуется скачивать/обучать лору на каждый чих.
Возможно, и вправду стоит упомянуть сразу и нуб и ваи, типо так:
> Какую модель выбрать начинающему? WAI-NSFW-illustrious-SDXL - популярный мёрдж на основе Illustrious-XL. Дает приятный базовый стиль и менее требователен к промпту (текстовому запросу), что делает его хорошим вариантом для тех, кто не хочет заморачиваться с тонкой настройкой.
NoobAI-XL - файнтьюн Illustrious-XL, лучше подходит для сложных стилистических запросов и вариативнее в генерации, но требует больше внимания к промпту.
>>1115421 > Там много всякой терминологии непонятной, и некоторые вещи плохо объяснены, типо инпейнта или контролнета. По инпеинту там вроде вообще инфы не было. По контролнету согласен, можно было лучше оформить. Там конечно ещё много что по хорошему надо бы дописать в целом. Если ещё свежо в голове, можешь подсказать, где терминология была непонятная? Я вроде пытался инфу расписывать по контексту, но инфы в целом много, наверняка что-то упустил.
>>1115434 >>NoobAI-XL - самый популярных файнтьюн аниме-модели Illustrious-XL на момент конца 2024 года > Хотя достаточно открыть главную цивитая, чтобы увидеть, что это не так. WAI-NSFW-illustrious- в разы популярней. ВАИ - это мёрдж, а не тьюн. У люстры в целом мало крупных тьюнов - я кроме нуба и роувей с ходу ничего и не вспомню. У той же хассаку датасет в 0.2M картинок, против 12M+ у нуба или ~2M у роувей.
Там никто еще на люстре 1.1 ничего не нафайнтюнил? Вроде лицензия позволяет. А то самому вспоминать пришлось, вот с wai12 0.60-0.40-0.60 и clip 0.33. Чуть мыльнее, но зато много стилей умеет и меньше ломает на больших разрешениях
>>1115850 Ну ё-моё. Ты б хоть нормальное что-то продемонстрировал, а не своих раздутых пупсов. Детализацию, стилистику, я не знаю. Грид с лежащей на спине Мику, в конце-концов, а то тут вон подрывы на эту тему уже который час идут.
>>1115842 >достаточно украсть приятные лично тебе картинки с метой из галереи модели Буквально вчера с этой целью заходил на страничку нуба на цивите. Приятных лично мне картинок нет. Какой-то сплошной арт, закос под акварель или карандаш, жирные мазки, грубые линии. Откроешь что-то более-менее приличное, а там состав:
лора на стиль, лора на персонажа, стабилизатор, эмульгатор, усилитель вкуса, цвета и детальности, пищевая добавка Е621. Может содержать следы коней и людей.
>>1115842 > ВАИ - это мёрдж, а не тьюн. У люстры в целом мало крупных тьюнов - я кроме нуба и роувей с ходу ничего и не вспомню. У той же хассаку датасет в 0.2M картинок, против 12M+ у нуба или ~2M у роувей. Что за роувей?
>>1115888 я там честно с промта в превью нуба даж прихуел, прям темные времена как будто вернулись. Теги с весами 1.4, эмбединги...
Не из нуба стандартного можно генерить и без всяких подкруток лор и эмбедов, но модель тогда надо пиздить ногами, так она еще сук сопротивляется тварь, чуть ли не в ответку тебе подсирает
>>1115836 > агрессией > Картинки где? Чел, у тебя все хорошо? Обратись к врачу.
Ну рили, это уже смешно. Я могу понять почему людям могут нравятся подобные миксы, они сразу дают приятные непритязательному взгляду, насыщенные и контрастные картинки без каких-либо сложностей и в дефолтных запросах достаточно послушны. Я могу понять почему их хейтят, ведь выглядят как остаебившая квинтесенция нейрокала, имеют сильный байас к стилю, композиции, позам и знания только базовой люстры. Могу восхититься теми, кто смог как-то увязать миксы с другими моделями в своем пайплайне, используя преимущества с каждой стороны. Но вот поднадусеровых поехов, с пеной у рта утверждающих что ваикал - вершина развития и самое лучшее - никак. Ну, точнее и их могу, выходит что это действительно лучшее что они смогли осилить, свое мнение считают единственно верным, свои поделия - воплощением себя и любая критика даже используемых средств = личная обида и оскорбление. Отсюда и идут бурления, параллельно способ самореализации и привлечения внимания. Соответственно, выходит что это крикливые унтерменьши, возгласы которых должны быть преданы анафеме.
Ну и встает выбор - проигнорировать мусор чтобы не вляпаться и терпеть их агитацию, попробовать вразумить, рискуя потратить время в пустую встретив убежденного, которому хоть ссы в глаза - все божья роса, или просто кинуть какаху, обозначив статус и отношение.
>>1115842 > У люстры в целом мало крупных тьюнов - я кроме нуба и роувей с ходу ничего и не вспомню Их в всего 3 существует - нуб, роувей и новые версии люстры. Остальное мелочь или вообще запеченные лоры. > хассаку датасет в 0.2M картинок Для последней версии уже 0.3М по заявлениям. Отобранные по эстетике и высоким оценкам, самый крупный из эстетических тюнов/ > ~2M у роувей 7М заявлено, из них 2М с натуртекстом. Если расширить границы, то за последние пол года из реальных тюнов аниме моделей к этим можно добавить только ньяфлоу, анимейджин4 и условно хрому, пони в7 на подходе. То есть, _все_ существующие файнтюны можно пересчитать по пальцам, поэтому нытье про засилье инцест миксов актуально как никогда. >>1115902 https://civitai.com/models/950531
>>1115968 > поднадусеровых поехов, с пеной у рта утверждающих что ваикал - вершина развития и самое лучшее - никак. > выходит что это действительно лучшее что они смогли осилить, свое мнение считают единственно верным, свои поделия - воплощением себя и любая критика даже используемых средств = личная обида и оскорбление.
Чет не помню чтоб такое писал Вообще писал что без негатива братиш если что. Я говорил только что ваи не говно и в целом нормальная модель и хейт в ту сторону не оправдан. Приводил примеры но все бестолку. Я не говорил что стандартные модели говно, и не бегу срать под средним артом на ваи что он слоп и ваикал. Проблем с промтом в целом то не испытываю, что полтораха, что пони, что люстра 1,0 (какая она ж не оч, но промты там выходили иногда прикольные довольно) да тот же стандартный нуб на котором сейчас лис сделал своих, все промтится при желании и без всяких лор и эмбедингов и других танцев с бубном >>1115947 не ну весы 1.4 (в других превью нуба видел 1.5 все равно чет пиздец конеш)
Те же самые ваи так же при промте показывают хороший результат
Но короч, без негатива, каждый в целом прав по своему, а спорить как говориться можно вечно. Вон тебе лиса покушать готовит.
>>1116005 Значит друг друга не поняли. Тут же еще разные люди пишут, агрессоры в диалоги влезают о обостряют ерунду. Добрее нужно быть, здесь все твои друзья. > Вон тебе лиса покушать готовит. Хорошенькая. > лучше бы тянку с жопой скинул чтоли Слышработать.жпг пока, вечером надо будет.
waiNSFWIllustrious_v120 Какое разрешение юзают аноны? В гайде указанно больше 1024х1024, но какое есть разница? Попробовал картинку из примера с настройками из примера и вылетело с ошибкой памяти при апскейле. 15 гб т4 видюха (колаб)
>>1116086 Думаю из-за тематики итт много залётышей малолетних из всяких тентакликов. Привыкли там токсить, а тут ещё и анонимно и пошло говно по трубам... Абориген анон-завсегдатай харкача не настолько токсичен на самом деле, это я точно знаю.
>>1116072 >Нуб это литералли лучшая анимешная модель Безумно ленится детализировать бэкграунды, да и персонажей тоже ленится рисовать, если не задать им кучу токенов. Вот к примеру.
> Но к слову, твой любимый шитмикс мочи с говном даже у люстры 1.1 сосет > У тебя что-то не так с настройками. > Безумно ленится детализировать бэкграунды, да и персонажей тоже ленится рисовать, если не задать им кучу токенов. > Сравнивает с впредом то что без впреда. Знаешь как работает впред, криворукий-говнодел с минусовый айсикю? > Потому что sdg - это дохлый самоподдувный аватаркофажный чатик.
>>1115968 >Ну рили, это уже смешно. Демонстрации, какой ваи - кал, а нуб - офигенный, так и нет. Штош.
>Но вот поднадусеровых поехов, с пеной у рта утверждающих что ваикал - вполное говно, без вариативности, которое ни во что не может... Исправил тебя, не благодари. Чел, претензии именно к этому. Каждый раз стоит упомянуть, что используешь ваи - тут же появляется какой-то "поднадусеровых поех", выдающий про "слоп". и ты в их числе, да? При этом без дефениции "слопа" и без демонстрации "не-слопа". Остальная твоя агрессия совершенно мимо кассы, ведь ты очевидно пытаешься принизить всех, кто юзает ваи, хотя и пытаешься показать, что нет. >попробовать вразумить, рискуя потратить время в пустую Чел. Вразумление так не работает. Крики "кококо! слоп! кал!" не работают. Только примеры. Наглядные. Подробные. И я их от тебя не вижу что-то.
>>1116037 >>1116161 Так чего показать то хотел? Одинаково лажают обе, что в количестве персонажей, что в анатомии, что в протечке токенов между персонажами. Всей разницы - стилистика, плюс пред/эпсилон.
>>1115631 Ты какую модель юзаешь? Откуда у них мышцы взялись-то? У меня рандомом тоже чето вышло, но чтоб стабильно выдавало то что нужно хз какой промпт юзать, хотя про нтр тег не подумал, надо попробовать >>1115663 Региональный промпт это что? На комфи есть такое?
>>1116260 Дед (по виду рук), ты зачем чужой костюм надел и 3ю ногу отрастил? >>1116331 И не такое переживали, сами отвалятся. >>1116349 > позови её по имени и налей саке. Она придёт. Не работает. Ебать ты, а ну давай чини руку и хвост.
>>1116086 Ты давно в хдг заходил? Тут хотя бы не вайпают, как там иногда, да и уровень дискуссии тут повыше.
>>1116386 > Региональный промпт это что Позволяет задать промпт какому-то конкретному региону на изображении, под комфи есть, в крита плагине поддержка есть.
>>1116417 >А вообще удивлен, что никто 4о нативный ген не обсуждают, он прикольный, много чего веселого с ним можно делать. Мне вообще интересно, сколько мощностей потребуется, чтобы такую ебанину локально запускать. Может через пару лет дооптимизируют и до локального состояния, хз.
>>1116386 >Откуда у них мышцы взялись-то? Так Даркнесс ж по лору должна быть довольно мускулистая, насколько я помню. Это просто трусишки-японцы мышцы женским персам в аниме толком не рисуют. Вот я и запромптил. Но на фанартах она частенько подтянутая, так что раз через десять нейронка мускулы плюс-минус правильно по персам раздает. Ну и "протечки" с НТР-тега, понятное дело - агли бастарда я в негатив записал, так что остаются только нигры-качки, лол.
>>1116366 Я просто не понимаю, что тебе на картинке нравится и как ты собираешься это воспроизвести на том непредсказуемом комбайне, который мне подогнали англоязычные братишки с цивита и который я ковыряю из любопытства. Тот же самый промпт на нубаи выдаёт пик 2. Полагаю, знатоки этой модели могут нарисовать детальнее.
>>1116390 >Не работает. А ты ждал, она за саке батрачить будет?
>>1116417 >А вообще удивлен, что никто 4о нативный ген не обсуждают Слишком казуальная штука, которую рубит собственная идея. Возможность задать запрос словами естественного языка довольно хороша, но чем сильнее это становится ремеслом, тем меньше там остаётся от разговорной речи. У чат гпт хороший промпт будет в итоге развития этой идеи примерно таким же нудным и въедливым, как юридический договор на пятидесяти листах.
Проще сразу признать, что люди не могут общаться с реальностью исполнения желаний на человеческом языке.
>>1116417 >он прикольный, много чего веселого с ним можно делать. >извините, я не могу обработать этот запрос Я удивлен, что он слова woman и female вообще знает, если честно.
>>1116083 >у вас тут токсичности больше чем у дедов в реалистиктреде NOT SCIENTIFICALLY POSSIBLE!
Скачал нуб. Всё что не ван герл стендинг ужасно плохо генерирует, мутанты, проебанная геометрия, зажарка в красный/синий Использую форкфлоу который в описании модели. Как можно настолько плохую модель выкладывать и почему она так популярна?
>>1116417 > 4о нативный ген не обсуждают Всратоват и малопригодный для анимы, после далли вау эффекта уже нет. >>1116464 > что тебе на картинке нравится Спавн мелких бессвязных объектов с бустом локального контраста при дефиците глобального, мыло, ограниченный диапазон с уходом в коричневые тона, беды с когерентностью, дефолтный дефолт с летающими горами и блумом, который кричит о нейроте в плохом смысле по превьюшке. Вариант нуба на этом фоне даже приятнее, не смотря на более аляповатый задник. Не он, если что. > ждал, она за саке батрачить будет Да ты знаешь сколько оно стоит! Лол, здесь как минимум обнимашки нужны.
>>1116276 могу пукнуть своей стандартной лисичкой на стандартном нубаи за того анона :D
ну в целом конечно промтинг похож на пинание ленивого скота чтоб работал как опять же писал тут >>1115947 весы в 1.4-1.5 (в одном примере видел и 2 весы и блять 15! я хуй знает такой вес воообще работает, чет никогда на практике выше 1.5 не поднимал) ((())) на куалити теги на превью модели и шизопромты, эт конеш пиздец, но генерил лис без таких танцев с бубном (хотя весы 1.2 проскакивают), плюс опять же для нормального гена нужен подробный промт, четкий кфг и удар палкой по хребту модели чтоб поменьше там креативила. модель конечно не для залетного мимокрока, промтить на ней не сказать что прям легко.
>>1116508 не ебись там, лучше ваинуба качни и не парься
>>1116518 Говоря кратко, ты хочешь флэт аниме вместо всего остального.
>>1116519 Слоп - это буквально всё, что не нравится. Избежать этого невозможно, просто положи на чужие мнения когда убедишься, что уже наигрался с генерацией и не извлечёшь из неё ещё больше фана.
>>1116550 Шизопромпты на то и шизо, что они могут даже приличную модель выдать абсолютный трэш и угар.
>>1116519 Короче, есть два типа художников. Оба типа рисуют и создают шедевры. Но одни из них ебутся в жопу и называют творчество вторых "слопом". Больше никакой разницы нет.
>>1116444 > локалки Тут половина треда были споры про диффузионные модели вс авторегрессия, так что 4о и сопутствующие обсуждения тут в тему. (В особенности обратите внимание на скорость его работы и как работает превью картинок во время генерации)
Да и я уже который тред практически полностью кидаю свои генерации от новелов, что локалкой тоже не является.
>>1116466 >он прикольный, много чего веселого с ним можно делать. >извините, я не могу обработать этот запрос > Я удивлен, что он слова woman и female вообще знает, если честно. По сравнению с далле, вообще проблем нет. У меня пока ни разу не рефьюзил.
>>1116452 > У чат гпт хороший промпт будет в итоге развития этой идеи примерно таким же нудным и въедливым, как юридический договор на пятидесяти листах.
А ты его весь сам собираешься писать? Я даже сейчас не особо часто свои промпты пишу руками.
>>1116518 >Всратоват и малопригодный для анимы Есть такое, но для того, чтобы какую-нибудь мемную картинку сделать хорошо подходит.
>>1116588 > Только для мемчиков и годно. В основном потому что в желтую палитру склоняется, если его не пинать специально в другую сторону. (но это и локалки некоторые тоже бывают делают).
>>1116591 >Вот эта схема или что поновее есть? В Inspire-Pack вроде бы была штука поудобнее, но я давно руками ноды не соединял под рег промпты, спасибо крита плагину.
>>1116706 Я уже не уверен, тролль ты или просто сознательно убиваешь очередной тред. Весь мир генерит на нубе. Во всех гайдах включая итт нуб. Но одному залетному неосилятору НЕПРИЯТНО, поэтому он игнорирует очевидное.
>>1116508 >Как можно настолько плохую модель выкладывать и почему она так популярна? Люди любят страдать.
>>1116518 >Да ты знаешь сколько оно стоит! Это потому что ты не работаешь на земле руками. Не владея землёй, ты всегда будешь платить больше, чем стоит твоё существование.
>>1116929 >Весь мир генерит на нубе. Пик 2: число скачек нуба. Пик 3: число скачек ваи люстры.
>>1117001 >Anything Тебя подводит память. Эни был честным китайским тюном, а не инцест-мержем. Это потом с ним начали плодить те самые мержи и возник термин.
Ваи вообще давно паразитируют так. Они и в поняч свой слова вжаривали. Эксперты по аутизму также набегали с большими ложками за добавкой.
>>1116103 Я не шарю. Зашел на страницу модели, выпущена на месяц раньше, те же настройки, тот же неправильный семплер, тот же промпт. Те же вангерл стендинги в галерее. В чем разница?
>>1117060 >тюн Это был мерж, узкоглазый автор мержа литералли писал что замержил всё что ему понравилось, и назвал модель "Всё / Что угодно" (Anything). И увидел он, что это хорошо.
Кек, какая же эта модель пони хорни. Генерировал на конкурс и ни одна картинка с людьми и гуманоидами не выдерживает даже внутреннего отсева, потому что то там декольте до пупа, то непонятная субстанция на лице.
>>1117530 > Или это конкурс на призм по аутизм миксу? На цивите проводятся конкурсы по одному из трёх типов моделей: base SDXL, Flux, Pony. Очень редко на Illustrous. Не то чтобы я надеялся выиграть, просто участие в конкурсах даёт мелкие бонусы и бенефиты - начиная от двухсот баззов для генерации лор средствами сайта и заканчивая новыми знакомствами и подписчиками.
>>1117757 Чел? Чтобы сделать вывод про оффлайн, не нужно организовывать конфу. Тем более, что все и так друг друга знают и узнают на других ресурсах по едва уловимым намёкам толщиной в сотни генераций.