திசைகாட்டி

துறை முகம்: எதிர்காலத்துக்கான துறை தரவு அறிவியல்

ஜெய்

தொடக்கத்தில் முக்கியமான சில படிப்புகள் மட்டுமே இருந்தன. ஆனால், பயன்பாட்டைப் பொறுத்துப் பல விதமான புதிய படிப்புகள் அறிமுகமாயின. எடுத்துக்காட்டாக, பொறியியல் படிப்புகளைப் பொறுத்தமட்டில் இயந்திரவியல், கட்டிடவியல், மின்னியல், மின்னணுவியல் ஆகிய முதன்மைப் படிப்புகளே இருந்தன. ஆனால், அதற்கு இன்ஸ்ட்ருமெண்டேசன், மெக்கட்ரானிக்ஸ், மரைன் என்பது போன்ற பல படிப்புகள் வந்துவிட்டன. இதுபோல் அறிவியல் துறையிலும் பல படிப்புகள் இருக்கின்றன. அப்படிப்பட்ட ஒன்றுதான் தரவு அறிவியல் (Data Science).

எதிர்காலத்தில் கோலோச்சப்போகும் துறைகளில் தரவு அறிவியலும் ஒன்று என வல்லுநர்கள் கூறுகிறார்கள். இப்போது தரவுப் பொறியாளர், தரவு அறிவியலாளர், தரவு ஆய்வாளர் எனப் பலவிதமான பிரிவுகளில் இதற்கான வேலைவாய்ப்புகள் கொட்டிக் கிடக்கின்றன.

தரவு அறிவியல் (Data Science) என்றால் என்ன?

தரவு அறிவியல் என்பது ஒரு தகவல் தொழில்நுட்பப் பிரிவு. தரவுகளை ஒருங்கிணைத்து, அவற்றை ஆராய்ந்து, அவற்றில் பயன்படக்கூடிய தகவல்களைப் பிரித்தெடுத்து குறிப்பிட்ட புதிய தரவை உருவாக்குதல் எனச் சொல்லலாம். எடுத்துக்காட்டாக, யுடியூபில் பார்க்கப்படும் வீடியோக்களின் அடிப்படையில் ஒரு தரவு உருவாக்கப்படுகிறது. ஃபேஸ்புக்கில் இருக்கும்போது நாம் பார்த்த வீடியோவை ஒத்த பொருள்களின் விளம்பரம் நமக்குக் காட்டப்படும். இதற்குப் பின்னால் பெரிய தரவுச் சேமிப்பு, தரவு ஆய்வு, தரவுகள் அடிப்படையிலான நிரல் ஆகியவை செயல்படுகின்றன. இதுபோல் பல துறைகளில் தரவு அறிவியல் பயன்படுகிறது. தரவு அறிவியலின் பயன்பாடு, இன்னும் விரிந்துகொண்டுதான் போகும்.

ஏற்கெனவே நடைபெற்ற விஷயங்களின் தரவுகளின் அடிப்படையில் இனி நடக்கப்போவதை யூகித்து, அதை எதிர்கொள்ளவும் தரவு அறிவியல் பயன்படுகிறது. தேர்தலை எதிர்கொள்ள இப்போது அரசியல் கட்சிகள் பெரும்பாலானவை தரவு அறிவியலை நாடுகின்றன. இன்றைக்குப் பல நிறுவனங்கள் தரவுகளின் அடிப்படையிலேயே செயல்படத் தொடங்கியுள்ளன.

தரவுகளைத் தொகுத்தல், தேவையில்லாத தரவுகளை நீக்கித் தரவுகளைப் பிரித்தல், தரவுகளை ஆராய்தல், தரவுகளின் அடிப்படையில் ஒரு மாதிரி உருவாக்குதல், தரவுகளைக் காட்சியாக வெளிப்படுத்துதல் ஆகிய ஐந்து அம்சங்கள் தரவு அறிவியலில் அடிப்படையானவை. எடுத்துக்காட்டாக, புதிய வீடு வாங்கவிருப்பவர்கள் தங்கள் விருப்பங்களான சமையலறை அமைப்பு, நடுக்கூட அமைப்பு போன்ற பலவற்றைக் குறித்து இடுகை இடுவார்கள். அவை எல்லாவற்றையும் தொகுப்பது முதலாவது அம்சம். அப்படித் தொகுத்தவற்றுள் நமக்குத் தேவையானதை, எடுத்துக்காட்டாக சமையலறை விருப்பங்களை மட்டும் தனியாகப் பிரிப்பது இரண்டாவது அம்சம். நம்முடைய தரவுகளில் உள்ள வீடுகளின் விலையை வைத்து, ஒரு வீட்டின் விலையை ஆராய்வது மூன்றாவது அம்சம். நம் தரவில் உள்ள வீடுகளின் விலையைக் கொண்டு புதிய ஒரு வீட்டின் விலையை மாதிரியாக உருவாக்குவது நான்காவது அம்சம். இந்தத் தரவுகளை ஒரு வரைபடமாக அறியத் தருவது ஐந்தாவது அம்சம்.

இணையத்தில் இதுபோல் தரவுகள் எளிதாகக் கிடைப்பது சாத்தியமாக உள்ளது. ஆனால், இணையம் இல்லாத நிறுவனங்களுக்கான தரவுகளுக்குச் சில நிரல்கள் இருக்கின்றன. ஆர் (R) புரோகிராமிங், டாப்ளூ (Tableau), மைக்ரோசாஃப்ட் பிஐ (BI), கூகுள் சார்ட்ஸ் (Charts), பைதன் (Python), சாஸ் (SAS) போன்ற பல நிரல்கள் உள்ளன.

யாரெல்லாம் படிக்கலாம்?

கணிதம், புள்ளியல் ஆகியவற்றில் ஆர்வம் உள்ளவர்களால் இந்தத் தரவு அறிவியலை எளிதாகப் படிக்க முடியும். அது மட்டுமல்ல கணினி அறிவியல், புள்ளியியல், கணிதம், பொறியியல் படித்தவர்கள் இந்தத் துறையைத் தேர்ந்தெடுப்பது பொருத்தமானதாக இருக்கும். தரவுகளுடன் புழங்குவதற்கான மன ஆற்றலும் அவசியமானதாகிறது. எக்ஸெல் குறித்த அறிவும் தேவை. ஆர் (R) ப்ரோகிராமிங், டாப்ளூ (Tableau), மைக்ரோசாஃப்ட் பிஐ (BI), கூகுள் சார்ட்ஸ் (Charts), பைதன் (Python), சாஸ் (SAS) போன்ற நிரல்கள் குறித்த அறிவு இருப்பதும் அவசியமானது. இந்தத் தகுதிகளைக் கொண்டவர்கள் இதைப் படிப்பது கூடுதல் பலம்.

எங்கு படிக்கலாம்?

சென்னை ஐ.ஐ.டி.யில் இணைய வழியில் டேட்டா சயின்ஸ் படிப்பு படிக்கலாம். 12ம் வகுப்பு கல்வித் தகுதி மட்டுமே போது மானது. இந்தப் படிப்பில் அடிப்படை, பட்டயம், பட்டம் என மூன்று நிலைகள் உள்ளன. பட்டயத்துடன் முடித்துக் கொள்வதற்கான வாய்ப்பும் இதில் இருக்கிறது. இதற்கான தேர்வுகள் நேரடியாகத்தான் நடைபெறும். இது அல்லாமல் இன்னும் பல ஐ.ஐ.டி.களிலும் இந்தப் படிப்பு உள்ளது. சான்றிதழ் படிப்பாகப் பல தனியார் நிறுவனங்களும் இந்தப் படிப்பை வழங்குகின்றன. புள்ளியியல், கணினியியல், கணிதம் படித்தவர்களுக்கு முன்னுரிமை வழங்கப்படுகிறது.

SCROLL FOR NEXT