ओरिएंटेशन - वीडियो ट्रांसक्रिप्ट¶
AI-सहायता प्राप्त अनुवाद - अधिक जानें और सुधार सुझाएं
महत्वपूर्ण नोट
यह पेज केवल ट्रांसक्रिप्ट दिखाता है। पूर्ण चरण-दर-चरण निर्देशों के लिए, कोर्स मटेरियल पर वापस जाएं।
स्वागत¶
नमस्ते, Hello Nextflow में आपका स्वागत है। मेरा नाम Phil Ewels है। मैं Seqera में Open Source के लिए Product Manager हूं, और मुझे आज आपको इस पहले Nextflow प्रशिक्षण कोर्स में ले जाने में खुशी हो रहा है।
हम Nextflow की बेसिक्स के बारे में जानेंगे, यह समझाएंगे कि pipelines को कैसे लिखा और चलाया जाता है और उन्हें कैसे कॉन्फ़िगर किया जाता है।
और आप अपनी खुद की सरल मल्टी-स्टेप pipeline बनाएंगे। हम operators और channel factories जैसी शब्दावली को कवर करेंगे, और कोर्स के अंत तक, आप अपनी खुद की bioinformatics pipelines बनाना शुरू करने के लिए तैयार होंगे।
अगर आपके कोई सवाल हैं, तो कृपया community.seqera.io पर संपर्क करें। हमारे पास वहां एक बहुत सक्रिय Nextflow कम्युनिटी है, प्रशिक्षण के लिए समर्पित एक सेक्शन है, तो बस हमें बताएं कि आप कहां अटके हैं और कोई न कोई मदद करने में सक्षम होगा।
ठीक है। चलिए शुरू करते हैं।
ट्रेनिंग वेबसाइट¶
Nextflow कोर्सों के लिए सभी प्रशिक्षण मटेरियल training.nextflow.io पर हैं। आप इसे अपने वेब ब्राउज़र में खोल सकते हैं। तो अभी इसे खोलें और हम एक नज़र डाल सकते हैं।
मैं इसे वर्जन 2.1.1 के साथ चला रहा हूं। हम यहां-वहां छोटे अपडेट और फिक्स पुश करते हैं, तो चिंता न करें अगर यह थोड़ा अलग है, लेकिन अगर मटेरियल बहुत ज्यादा बदल गया है, तो आप हमेशा मटेरियल के उस सटीक वर्जन को चुनने के लिए शीर्ष पर इस वर्जन पिकर का उपयोग कर सकते हैं जिसके बारे में मैं बात करने जा रहा हूं।
अगर आप लाइट मोड पसंद करते हैं, तो आप यहां वेबसाइट की थीम बदल सकते हैं।
यहां अनुवाद देखें, हालांकि रिकॉर्डिंग के समय, यह वास्तव में केवल अंग्रेजी है, जो इस नए मटेरियल को कवर करती है।
और प्रशिक्षण वेबसाइट के लिए सभी सोर्स कोड और वह सब कुछ जिसके साथ हम काम करेंगे, GitHub पर देखें।
यहां होमपेज हमारे पास सभी विभिन्न प्रशिक्षण मटेरियल कोर्सों को सूचीबद्ध करता है। तो मैं नीचे स्क्रॉल करता हूं, हम Nextflow for newcomers के साथ Hello Nextflow कोर्स देखेंगे जो हम यहां करेंगे। आप अन्य सभी कोर्स भी देख सकते हैं जो हमारे पास हैं, जो इसी तरह काम करते हैं।
एनवायरनमेंट सेटअप¶
मैं वास्तव में शीर्ष पर इस पहले वाले का उपयोग करके शुरू करने जा रहा हूं, जो सभी प्रशिक्षण कोर्सों के लिए सामान्य है, और यह विशेष रूप से हमारे वातावरण को सेट करने के बारे में है।
मैं क्लिक करता हूं, यह मुझे इस सेक्शन में ले जाता है, और हम स्थानीय रूप से विकसित करने के लिए निर्देश देख सकते हैं। अगर आप अपने खुद के लैपटॉप के साथ VS Code की अपनी प्रति और अपने खुद के सॉफ़्टवेयर इंस्टॉलेशन का उपयोग करना चाहते हैं, या जो हम उम्मीद करते हैं कि अधिकांश लोग करेंगे, वह है GitHub Codespaces नामक किसी चीज़ का उपयोग करना।
Codespaces GitHub द्वारा प्रदान की गई एक सेवा है जहां वे क्लाउड में एक वेब सर्वर चलाते हैं, जिससे आप कनेक्ट कर सकते हैं। उस सर्वर पर VS code इंस्टॉल है, जहां आप इसे अपने वेब ब्राउज़र में चला सकते हैं, या यदि आप चाहें, तो इसे अपने VS code के लोकल इंस्टॉलेशन से कनेक्ट कर सकते हैं। सभी गणना, सभी फ़ाइलें, सभी संपादन दूर से होता है, जिसका मतलब है कि आपको जो भी सॉफ़्टवेयर चाहिए वह पहले से इंस्टॉल आता है और सभी के लिए समान है।
GitHub Codespace बनाना¶
सब कुछ के साथ codespace बनाने के लिए, डॉक्स मटेरियल में बटन खोजें, जो कहते हैं "Open in GitHub Codespaces"। मैं अभी उस पर क्लिक करने जा रहा हूं, इसे एक नए टैब में खोलूंगा। और मैं इस वेबपेज के साथ प्रस्तुत किया गया हूं। अब आप देख सकते हैं कि यह nextflow-io training के साथ पहले से कॉन्फ़िगर किया गया है।
मैं बस create new codespace पर क्लिक कर सकता हूं। लेकिन वास्तव में हम अनुशंसा करते हैं कि हम दो के बजाय चार CPUs के साथ Nextflow प्रशिक्षण के लिए थोड़ी बड़ी मशीन का उपयोग करें। आप बदल सकते हैं कि मटेरियल का कौन सा वर्जन उपयोग करता है। तो यह 2.1.1 पर डिफ़ॉल्ट हो रहा है क्योंकि यह उस डॉक्स का वर्जन है जिसका मैंने लिंक फॉलो किया था। लेकिन मैं इसे रिपॉजिटरी की एक विशिष्ट ब्रांच पर भी सेट कर सकता हूं अगर मैं चाहूं।
अब मैं create codespace पर क्लिक करने जा रहा हूं। और यह मेरे लिए वातावरण सेट अप करना शुरू करने जा रहा है।
Codespace निर्माण¶
अब, पहली बार जब आप ऐसा करते हैं, तो इसमें काफी समय लगने वाला है, तो अब चाय का एक कप लेने का अच्छा समय है। खुद को आरामदायक बनाएं, अपने बगल में बैठे व्यक्ति से चैट करें।
यदि आप रुचि रखते हैं, तो आप सेटअप के लॉग देखने के लिए यहां building codespace पर क्लिक कर सकते हैं। और आप यहां देख सकते हैं कि यह एक Docker इमेज को पुल कर रहा है जिसमें मुझे वह सब कुछ चाहिए जो मुझे चाहिए और वातावरण को कॉन्फ़िगर कर रहा है।
अब, आपको पहली बार codespace बनाते समय ही इस तरह इंतजार करना होगा। यदि आप github.com/codespaces यहां जाते हैं, तो आप सभी विभिन्न Codespaces देखेंगे जो आपके पास खुले हैं। यहाँ वह है जो मैंने अभी बनाया है। अगली बार जब आप ऐसा करते हैं, तो आप यहां जा सकते हैं और आप पिछले codespace का चयन कर सकते हैं और सीधे वापस उसमें कूद सकते हैं। और उस मौजूदा वातावरण को गर्म करने के लिए यह बहुत, बहुत तेज़ प्रक्रिया है। यह VS Code और फ़ाइलों में किए गए सभी परिवर्तनों को भी रखेगा, इसलिए यदि आप छोड़ते हैं और वापस आते हैं तो आप अपनी प्रगति नहीं खोएंगे।
आप अन्य एक्शन करने के लिए यहां तीन डॉट्स पर क्लिक कर सकते हैं। उदाहरण के लिए, यदि आपने इसे दो CPUs के साथ कॉन्फ़िगर किया है और अब आप चार चाहते हैं, तो आप मशीन टाइप बदल सकते हैं। या यदि आप स्क्रैच और फ्रेश से शुरू करना चाहते हैं, तो आप codespace को डिलीट कर सकते हैं।
VS Code का परिचय¶
ठीक है, Codespaces ने मेरा वातावरण सेट करना समाप्त कर दिया है और अब वेब ब्राउज़र में VS Code के साथ प्रस्तुत किया गया है।
यदि आप VS code के आदी हैं। यह बहुत परिचित महसूस होगा यदि आपने इसे पहले उपयोग नहीं किया है, तो यह बहुत सरल है। पेज के कुछ अलग-अलग हिस्से हैं जिनके बारे में आपको जागरूक होना चाहिए।
यहां बाईं ओर, हमारे पास साइडबार है। आप प्रशिक्षण रिपो से GitHub रिपॉजिटरी में सभी विभिन्न फ़ाइलों के साथ Explorer सेट देख सकते हैं।
बाईं ओर इन बटनों पर, साइडबार में विभिन्न टूलिंग हो सकते हैं। मैं प्रोजेक्ट की सभी फ़ाइलों को खोज सकता हूं। मैं Git के साथ काम कर सकता हूं, GitHub के साथ काम कर सकता हूं, इस तरह की सभी अलग-अलग चीजें।
यहां शीर्ष पर मुख्य मेनू है। फ़ाइल एक्सप्लोरर वह है जो हम यहां सबसे अधिक रखेंगे, और आप इनमें से किसी भी फ़ाइल पर राइट क्लिक कर सकते हैं और सामान्य चीजें कर सकते हैं जिनकी आप अपेक्षा करेंगे। आपको इस तरह की कुछ चेतावनियों पर क्लिक करना पड़ सकता है जहां यह कट कॉपी जैसी है और आप अपनी लोकल मशीन पर भी डाउनलोड कर सकते हैं।
जब codespace लोड होता है, तो यह हमें यहां इस मुख्य क्षेत्र में markdown फ़ाइल का पूर्वावलोकन देता है। यह github.com पर रेंडर होने वाले के समान ही है। मैं इसे बंद कर सकता हूं और अगर मैं उस Readme फ़ाइल पर डबल क्लिक करता हूं, तो आप देखेंगे कि यह इसे कोड एडिटर में कोड के रूप में खोलता है और किसी अन्य फ़ाइल की तरह, हम इस कोड को सीधे संपादित कर सकते हैं।
अंत में यहां नीचे, हमारे पास टर्मिनल विंडो है। मैं लॉग देख रहा था जब यह बनाया गया था, तो यह वर्तमान चीज है जो यह दिखा रहा है। मैं एक नया टर्मिनल सत्र शुरू करने के लिए इस प्लस बटन को भी दबा सकता हूं। यह मेरी मशीन पर नहीं चल रहा है। याद रखें, यह क्लाउड में चल रहा है, और अगर मैं दो की गहराई तक tree करता हूं, तो आप वही सभी फ़ाइलें यहां देखेंगे, जो बाईं ओर थीं।
केवल "hello-nextflow" फ़ाइलें दिखाना¶
इस GitHub रिपॉजिटरी में सभी विभिन्न प्रशिक्षण सेट होते हैं, न कि केवल वह जो हम कर रहे हैं। तो यदि आप चाहें, तो आप केवल Hello Nextflow फ़ोल्डर पर ध्यान केंद्रित कर सकते हैं। इसे थोड़ा साफ करने का एक तरीका मेनू फ़ाइल में जाना है और फिर add folder to workspace।
हम उस पर क्लिक करते हैं training जाते हैं। Hello nextflow, और Add पर क्लिक करें। यह आपकी स्क्रीन को रिफ्रेश करेगा। और फिर Explorer में, अब हमारे पास दो अलग-अलग workspaces हैं, एक जो हमारे पास training के लिए पहले था और एक सिर्फ Hello Nextflow के साथ।
यदि आप चाहें, तो आप training पर राइट क्लिक कर सकते हैं और साइडबार से इसे पूरी तरह से हटाने के लिए remove folder from workspace पर क्लिक कर सकते हैं।
अब हमारे पास साइड में इस विशेष प्रशिक्षण कोर्स के लिए बस फ़ाइलें हैं। मैं उस चेतावनी को छिपा सकता हूं और अब मैं यहां टर्मिनल में भी ऐसा ही कर सकता हूं और डायरेक्टरी बदलने के लिए CD करता हूं। Hello, Nextflow। और फिर, हमारे पास वही फ़ाइलें यहां हैं, जो साइडबार पर हैं।
Hello Nextflow: फ़ाइलें¶
Hello Nextflow कोर्स के लिए इन फ़ाइलों को देखते हुए।
हमारे पास Nextflow के लिए .nf फ़ाइलों का एक समूह है, और प्रशिक्षण कोर्स के प्रत्येक अध्याय के लिए इनमें से एक फ़ाइल है। हम इन फ़ाइलों के माध्यम से काम करेंगे और अभ्यासों में उन्हें संशोधित करेंगे।
हमारे पास एक nextflow.config फ़ाइल भी है, जिसमें इस वातावरण में Nextflow चलाने के लिए बुनियादी कॉन्फ़िग सेटिंग्स हैं, जिनके बारे में आपको इस बिंदु पर वास्तव में चिंता करने की आवश्यकता नहीं है। एक greetings.csv फ़ाइल, जिसका उपयोग हम डेटा प्रोसेसिंग के लिए करेंगे, जो इस कोर्स के अगले भाग में पेश की जाएगी, और एक test-params.json फ़ाइल, जिसका उपयोग भाग छह में किया जाएगा और आप अभी के लिए अनदेखा कर सकते हैं।
ये Nextflow फ़ाइलें प्रत्येक अभ्यास की शुरुआत हैं। यदि आप देखना चाहते हैं कि वे कैसे दिखनी चाहिए जब वे समाप्त हो जाएं, तो आप solutions डायरेक्टरी में जा सकते हैं और प्रशिक्षण कोर्स के प्रत्येक भाग के लिए उत्तर हैं, ताकि आप जिस ओर लक्ष्य रखते हैं उसका एक काम करने वाला वर्जन देख सकें।
टर्मिनल खोलना¶
यदि किसी भी समय आप टर्मिनल बंद करते हैं और याद नहीं रख सकते कि वापस कैसे जाना है, तो इसके बारे में चिंता न करें। workspace में विभिन्न पैनल खोलने और बंद करने के लिए शीर्ष पर ये बटन हैं। तो bottom panel के लिए इस पर क्लिक करें और यह फिर से प्रकट होगा। और बस सुनिश्चित करें कि आपने यहां terminal चुना है। आप इसे फुल स्क्रीन बनाने के लिए यहां इस बटन पर भी क्लिक कर सकते हैं, टर्मिनल के दाईं ओर तीर।
आप मुझे ऐसा बहुत करते देखेंगे क्योंकि मैंने VS Code को ज़ूम इन किया है ताकि आप टेक्स्ट पढ़ सकें। आपकी स्क्रीन के आकार के आधार पर, आपको यह करने की आवश्यकता हो सकती है या नहीं। यही बात साइड पैनल को minimize करने के लिए भी जाती है।
ठीक है। वातावरण के लिए यह काफी है। मुझे लगता है कि हम शुरू करने के लिए तैयार हैं। अध्याय एक के लिए अगले वीडियो में मेरे साथ जुड़ें।