இணைய UI இல் உரை-தலைகீழை இயக்க, கோப்புகளை உங்கள் நிலையான-பரவல் கோப்புறையில் நகலெடுக்கவும்.
வெபுய் ஒருங்கிணைப்பில் ஏதேனும் சிக்கல்களை நீங்கள் சந்தித்தால் , தயவுசெய்து ஒரு சிக்கலை இங்கே உருவாக்கவும்.
உங்களுக்கு டெக்ஸ்ட்வல் இன்வெர்ஷனை நிறுவுவதில் அல்லது இயக்குவதில் சிக்கல் இருந்தால், கீழே உள்ள கேள்விகளைப் பார்க்கவும். உங்கள் பிரச்சனை பட்டியலிடப்படவில்லை எனில், அதிகாரப்பூர்வ ரெப்போ இங்கே.
உரை-தலைகீழ் – ஒரு படம் ஒரு வார்த்தைக்கு மதிப்புள்ளது: டெக்ஸ்ட்யூவல் இன்வெர்ஷனைப் பயன்படுத்தி டெக்ஸ்ட்-டு-இமேஜ் ஜெனரேஷன் தனிப்பயனாக்குதல் (கடன்: டெல் அவிவ் யுனிவர்சிட்டி, என்விடியா)
தனிப்பட்ட பொருள்கள் அல்லது கலை பாணிகள் போன்ற குறிப்பிட்ட கருத்துகளை, முன் பயிற்சி பெற்ற உரையின் உட்பொதிப்பு இடத்தில் புதிய “சொற்களை” பயன்படுத்தி விவரிப்பதன் மூலம் அவற்றை உருவாக்க கற்றுக்கொள்கிறோம். -பட மாதிரிகள். வேறு எந்த வார்த்தையையும் போலவே புதிய வாக்கியங்களிலும் இவை பயன்படுத்தப்படலாம்.
அடிப்படையில், இந்த மாதிரியானது ஒரு பொருள், நடை போன்றவற்றின் சில படங்களை எடுக்கும் மற்றும் நிலையான பரவல் போன்ற டெக்ஸ்ட்-டு-இமேஜ் மாடல்களால் புரிந்து கொள்ளக்கூடிய வகையில் அதை எவ்வாறு விவரிக்க வேண்டும் என்பதைக் கற்றுக் கொள்ளும். இது உங்கள் தூண்டுதல்களில் குறிப்பிட்ட விஷயங்களைக் குறிப்பிட உங்களை அனுமதிக்கிறது, அல்லது வார்த்தைகளை விட படங்களின் மூலம் வெளிப்படுத்த எளிதாக இருக்கும்.
WebUI மூலம் நீங்கள் எதையும் செய்வதற்கு முன், நீங்கள் முதலில் Textual-Inversion மாதிரியைப் பயிற்றுவிப்பதன் மூலம் உட்பொதிக்கும் கோப்பை உருவாக்க வேண்டும். மாற்றாக, நீங்கள் இங்கிருந்து முன்பே தயாரிக்கப்பட்ட உட்பொதிவுகளில் ஒன்றைச் சோதிக்கலாம்.
WebUI இல், உட்பொதிப்புகள் கோப்பு பதிவேற்ற பெட்டியில் உட்பொதித்தல் கோப்பை வைக்கவும். பின்னர் ஐப் பயன்படுத்தி உட்பொதிப்பைக் குறிப்பிடலாம் உங்கள் வரியில்.
அசல் ரெப்போ
பயன்படுத்தி பயிற்சி சிறப்பாக செய்யப்படுகிறது
எச்சரிக்கை: இது மிகவும் நினைவாற்றல் மிகுந்த மாடலாகும், எழுதுவது போல், SD உடன் வேலை செய்ய உகந்ததாக இல்லை. உங்கள் உள்ளூர் சாதனத்தில் இதைப் பயிற்சி பெற குறைந்தபட்சம் 10ஜிபி VRAM கொண்ட என்விடியா ஜிபியுவும், நியாயமான நேரத்தில் பயிற்சி பெற 20ஜிபி+ கொண்ட ஜிபியுவும் தேவைப்படும். உங்களிடம் கணினி ஆதாரங்கள் இல்லையென்றால், நீங்கள் Colab ஐப் பயன்படுத்த வேண்டும் அல்லது SD சிறப்பாக ஆதரிக்கப்படும் வரை முன் பயிற்சி பெற்ற உட்பொதிவுகளுடன் ஒட்டிக்கொள்ள வேண்டும்.
இந்த வழிமுறைகள் உங்கள் உள்ளூர் சாதனத்தில் பயிற்சிக்கானவை என்பதை நினைவில் கொள்ளவும், Colab இல் பயிற்சிக்கான வழிமுறைகள் மாறுபடலாம்.
நீங்கள் விவரிக்க விரும்பும் மாதிரியின் 3-5 படங்கள் தேவைப்படும். நீங்கள் அதிகமான படங்களைப் பயன்படுத்தலாம், ஆனால் காகிதம் 5 பரிந்துரைக்கிறது. சிறந்த முடிவுகளுக்கு, படங்கள் பார்வைக்கு ஒத்ததாக இருக்க வேண்டும், மேலும் ஒவ்வொரு படமும் 512×512 ஆக செதுக்கப்பட வேண்டும். வேறு எந்த அளவுகளும் மறுஅளவிடப்படும் (நீட்டப்படும்) மற்றும் விசித்திரமான முடிவுகளை உருவாக்கலாம்.
படி 1:
பொருள்/கலைமுறை/காட்சி/முதலியவற்றின் 3-5 படங்களை வைக்கவும். வெற்று கோப்புறையில்.
படி 2:python main.py --base configs/stable-diffusion/v1-finetune.yaml -t --actual_resume models/ldm/text2img-large/model.ckpt -n <இந்த இயக்கத்திற்கு பெயரிடுங்கள்> --data_root path/to/image/folder --gpus 1 --init-word <உங்கள் init word>
–பேஸ் ஸ்கிரிப்டை பயிற்சி உள்ளமைவு கோப்பில்
–actual_resume ஸ்கிரிப்டை டெக்சுவல்-இன்வெர்ஷன் மாடலில்
–n பயிற்சிக்கு ஒரு பெயரை வழங்குகிறது, இது வெளியீட்டு கோப்புறை பெயராகவும் பயன்படுத்தப்படும்.
–gpus நீங்கள் என்னவென்று உங்களுக்குத் தெரியாவிட்டால் 1 மணிக்கு வெளியேறவும் செய்து.
–init-word என்பது உங்கள் படங்களை முதல்முறையாகப் பார்க்கும்போது மாதிரி தொடங்கும் ஒற்றை வார்த்தை. எளிமையாக இருக்க வேண்டும், அதாவது: “சிற்பம்”, “பெண்”, “மலைகள்”
படி 3:
நீங்கள் உள்ளே நுழைந்து அதை நிறுத்தும் வரை மாடல் பயிற்சி தொடரும் CTRL+C. பரிந்துரைக்கப்பட்ட பயிற்சி நேரம் 3000-7000 மறு செய்கைகள் (உலகளாவிய படிகள்). ரன் எந்தப் படியில் உள்ளது என்பதை முன்னேற்றப் பட்டியில் பார்க்கலாம். பதிவுகள்/<உங்கள் இயக்கப் பெயர்>/படங்களில் படங்களை மதிப்பாய்வு செய்வதன் மூலமும் நீங்கள் முன்னேற்றத்தைக் கண்காணிக்கலாம். . அந்த கோப்புறையை மாற்றியமைக்கப்பட்ட தேதியின்படி வரிசைப்படுத்த பரிந்துரைக்கிறேன், இல்லையெனில் அவை குழப்பமடையும்.
படி 4:
நிறுத்தியதும், கீழ் பல உட்பொதிக்கும் கோப்புகளைக் காண்பீர்கள் பதிவுகள்/<உங்கள் இயக்கப் பெயர்>/சோதனைச் சாவடிகள். நீங்கள் விரும்பும் ஒன்று embeddings.pt.
படி 5:
WebUI இல், நீங்கள் உருவாக்கிய உட்பொதிவு கோப்பை பதிவேற்றவும். இப்போது, ஒரு வரியில் எழுதும் போது, நீங்கள் * பயன்படுத்தலாம் உட்பொதித்தல் கோப்பு விவரிக்கும் அனைத்தையும் குறிப்பிடுவதற்கு.
“ஒரு படம் ரெம்ப்ராண்ட் பாணியில்”
“கோர்கியின் புகைப்படம்”
“*”
பாணியில் ஒரு காபி குவளை
நினைவூட்டல்: அதிகாரப்பூர்வ ரெப்போ இங்கே==>
ரினோங்கல்/டெக்ஸ்ட்வல்_இன்வெர்ஷன்
அதிகாரப்பூர்வமற்ற ஃபோர்க், விண்டோஸில் மிகவும் நிலையானது (8/28/22)==> nicolai256/Stable-textual-inversion_win
*
மாதிரியானது “ஒரு புகைப்படம்” அல்லது உங்கள் அறிவுறுத்தலில் “புகைப்படமாக”
இனிஷியலைசர்_வார்த்தைகள்: v1-finetune.yaml. ஆர்டர் முக்கியமானதாக இருக்கலாம் (உறுதிப்படுத்தப்படவில்லை)
உடன் இணைக்கலாம் merge_embeddings.py -sd பல விஷயங்களைக் குறிப்பிட. மேலும் விவரங்களுக்கு அதிகாரப்பூர்வ ரெப்போவைப் பார்க்கவும்.
A: இந்த மாடல் மிகவும் VRAM கனமானது, 20GB என்பது பரிந்துரைக்கப்பட்ட அளவு. <12GB VRAM உடன் GPU இல் இந்த மாதிரியை இயக்க முடியும், ஆனால் உத்தரவாதம் இல்லை. அளவு: 512 ஆக மாற்ற முயற்சிக்கவும் அளவு: 448 இல்
v1-finetune.yaml -> தரவு: -> params:
இரண்டிற்கும் ரயில்: மற்றும் சரிபார்த்தல்:
. அது போதாது என்றால், உங்கள் பயிற்சியைச் செய்ய Colab நோட்புக் அல்லது பிற GPU ஹோஸ்டிங் சேவையைப் பயன்படுத்துவது சிறந்தது.
கே: பல சாதனங்கள் கண்டறியப்பட்டதில் நான் ஏன் பிழையைப் பெறுகிறேன்?
A: நீங்கள் –gpus 1 ஐப் பயன்படுத்துகிறீர்கள் என்பதை உறுதிப்படுத்திக் கொள்ளுங்கள் வாதம். நீங்கள் இன்னும் பிழையைப் பெறுகிறீர்கள் என்றால், main.py திறக்கவும் மற்றும் பின்வரும் வரிகளைக் கண்டறியவும்:
cpu இல்லையென்றால்: ngpu=len(lightning_config.trainer.gpus.strip(“, “).பிளவு(‘,’)) வேறு: ngpu=1
இந்த வரிகளை கருத்து தெரிவிக்கவும், பின்னர் அவற்றின் கீழே சேர்க்கவும் ngpu=1 (அல்லது நீங்கள் பயன்படுத்த விரும்பும் # GPUகள் ) இது ஒரே இடத்தில் இருப்பதை உறுதி செய்து கொள்ளுங்கள்