த
ரவுகள் பயன்பாட்டில் வந்த பொழுது அவை நிகழ்த்திய மகத்தான சாதனைகளைக் காட்டிலும் பெரிய மற்றும் மிகப் பெரிய தரவுகள் ஏற்படுத்தியுள்ள சாதனைகள் வியக்கவைக்கின்றன. வாக்குறுதிகள் முன்னேற்றம், பிரச்சினைகள், விளைவுகள் ஆகியன பெரிய தரவுகள் ஏற்படுத்திய மிகப் பெரிய புரட்சி. அதுவும் மனித குலத்தையும் கணினி இணைப்புகளை பிணைத்து புரட்டிப் போட்ட மிகப் பெரிய புரட்சியாகும். ஆரம்ப காலங்களில் தரவுகளை சேகரிக்கும் பொழுது அவைகளை புள்ளியியல் அமைப்புகளுக்கு ஏதுவாக வரையரை செய்து கொண்டோம். புள்ளியியல் கணிப்புகளுடன் தொலைநோக்கு பார்வையோடு சில செய்திகளை இணைக்கும் பொழுது, யூகங்களின் அடிப்படையில் மாறுபட்ட முடிவுகளையும், விளைவுகளையும் அவை ஏற்படுத்தின.
மதிப்பீடுகளில் மாற்றங்கள் வருவது தவிர்க்க முடியாமல் போனது. குழுக்களையோ சிறிய எண்ணிக்கையில் அடங்கிய தரவுகளையோ இணைக்கும் பொழுது அவை மதிப்பீடுதலில் தவறுகளை ஏற்படுத்தின. எண்ணிக்கை என்பது ஏதோ ஒரு எண்ணைக் குறிப்பிடுவதைத் தவிர்த்து பெரிய தரவுகளில் எண்ணிக்கை என்பது எல்லாம் சேர்ந்தது என்ற மாற்றத்தை ஏற்படுத்தியது. ஒரு கட்டமைப்பில் ஒரு குறிப்பிட்ட காரணிகளை மட்டும் எடுத்து மதிப்பீடு செய்யும் பொழுது விடைகள் தெளிவானவையாக இல்லாமல் இருக்கலாம். ஆனால் அனைத்தையும் ஒருங்கிணைத்து அவைகளை ஆய்வு செய்யும் பொழுது ஏற்படக் கூடிய மதிப்பீட்டின் நிறைவுகள் மிகப் பெரிய மாற்றங்களை ஏற்படுத்தும். சிறிய மரங்களாக சேர்த்து கணக்கு காட்டியது போக ஒரு பெரிய காடாக அவைகளை ஒன்றிணைத்து பார்க்கும் பொழுது ஏற்படக்கூடிய வியப்புதான் பெரிய தரவுகளில் மற்றும் மிகப் பெரிய தரவுகளில் தாக்கத்தை ஏற்படுத்தியுள்ளன.
மாதிரிகளை எடுத்து ஆய்வு செய்வதைக் காட்டிலும் மொத்தத்தையும் எடுத்து ஆய்வு செய்யும் பொழுது ஏற்படக் கூடிய நிகழ்வுகள் மிகவும் வித்தியாசமானவையாக இருக்கும். விமான பயணச்சீட்டுகளை பெறும் பொழுது குறிப்பிட்ட காலங்களில் நிகழக் கூடிய மாற்றங்களுக்கு ஏற்ப பயணக் கட்டணம் சீரமைக்கப்படும். மாதிரிகளை எடுத்து முடிவு செய்வதை விட மொத்த தரவுகளையும் எடுத்து குறிப்பிட்ட கால கட்டங்களில் விமான சீட்டு குறைந்த செலவில் கிடைக்கும் என்ற முடிவுகளை எடுக்கும் பொழுது அவைகளை பயன்படுத்த மக்கள் தயங்க மாட்டார்கள். அது போன்ற முடிவுகள் பயண சீட்டு வாங்குபவர்களுக்கு ஏற்புடையதாக இருக்கும் என்பதில் மாற்று கருத்துகள் இருக்க முடியாது.
முட்டாள் தனமான செயல்களாக மக்கள் கருதும் சில செயல்களுக்கு பெரிய தரவுகள் விடை கொடுத்துவிடும். ஆக்க பூர்வமான, அறிவு பூர்மான, செயல் முறை சார்ந்த முடிவுகள் அனைத்து தரவுகளையும் பயன்படுத்தும் போது கிடைப்பது மிகவும் தேவையான ஒன்றாகும். அதே போல புற்றுநோயாளிகளுக்கு ASPIRIN என்ற மருந்தும் ஆரஞ்சு சாறும் நோயை குறைப்பதற்கான காரணிகளாக மாதிரிகளை எடுத்து முடிவுகளை மேற்கொண்டார்கள். அது போன்ற நேரங்களில் பெரிய தரவுகளை பயன்படுத்தி அனைத்து நோயாளிகளையும் ஆய்வுக்குள் கொண்டு வந்தார்கள் அப்பொழுது அவர்கள் எந்த காரணிகளால் அனைவரும் அதிக காலம் உயிர் வாழ முடிந்தது என்பதைப் பற்றிய புரிதலை மற்றவர்களுக்கு அளிக்க முடிகிறது. மாதிரிகளில் எடுக்கப்பட்ட சோதனை முடிவுகள் நிச்சயமாக குறிப்பிட்ட அளவு நோயாளிகள் ஏன் தாமதமாக மரணம் அடைந்தார்கள் என்ற கேள்விக்கு விடை கிடைக்காது. ஆனால் பெரிய தரவுகள் மூலம் என்ன காரணத்தால் எத்தனை பேர் மரணத்தை ஒத்திப் போட்டார்கள் என்பது தெரியாவிட்டாலும், எண்ணிக்கை அளவில் நம்பிக்கை அளிப்பது மன உறுதியை கூட்டும். ஆய்வு முடிவுகளும் பெரும் அளவில் நோயாளிகளின் நம்பிக்கையை வளர்க்கும்.
மாதிரி ஆய்வுகளில் கருதுகோள்களை ஏற்புடையதாகவோ அல்லது எதிர் மறையாகவோ நிருபிக்க வேண்டிய கட்டாயம் உண்டு. ஆனால் பெரிய தரவுகளைப் பயன்படுத்தி மேற்கொள்ளும் ஆய்வுகளில் மற்ற கருதுகோள்களையும் மற்ற பேருண்மைகளையும் ஒன்றாகவோ, வெட்டியோ இருக்க வேண்டிய சூழ்நிலை இல்லை. அந்த ஆய்வுகளை மேற்கொள்ளும் ஆய்வாளர்களின் பார்வையும் என்ன தோன்றுகிறது என்பதை பொருத்தே ஆய்வு முடிவுகளை மேற்கொள்ள வேண்டியது இருக்கும்.
அமேசான் நிறுவனம் கிண்டில் இ புக் உபயோகிப்பவர்களைப் பற்றிய பல தரவுகளை வாங்கியது. மிகவும் அதிகம் படிக்கப்பட்ட குறிப்பிட்ட பகுதிகள் அவை ஏன் மற்றவர்களால் முழுமையாக படித்து முடிக்க முடியவில்லை பயனாளிகளின் தேவைக்கான மதிப்பீடு ஆகியவை பற்றி முழு தரவுகளும் கிடைக்க பெற்றிருந்தார்கள். இன்னொரு புத்தக வெளியீட்டு நிறுவனம் இதே போன்ற தரவுகளை வாங்கியிருந்தால் அவைகளை வியாபார உத்திகளுக்காகவும், விளம்பரத்திற்காகவும் நூல் ஆசிரியர்களின் எழுச்சியான நடைக்காகவும், சந்தைப்படுத்தும் உத்திகளுக்காகவும் பயன்படுத்தி இருக்கும். ஒரே வகையான தரவுகளை எவ்வாறு பயன்படுத்துகின்றோம் என்பதில் பெரிய தரவுகள் மிகப் பெரிய மாற்றத்தை உண்டாக்கும்.
கணினி நினைவுத் திறன் என்பது மிகவும் விலை உயர்ந்த காரணத்தினால் நான்கு இலக்கங்களை 1999 என்பதற்கு பதிலாக இரண்டு இலக்கங்களாக 99 என்று எழுதினார்கள். ஆனால், இன்றைய தேதியில் தரவுகளை சேமித்துவைக்கும் இட அளவு மிகவும் மலிவான விலையில் கிடைக்க ஆரம்பித்துவிட்டது. பத்து லட்சம் பைட்டுகளைக் கொண்டு முழு நீளத் திரைப்படத்தை சேமித்து வைக்க முடியும்.
ஆகையால் இன்றைய கால கட்டங்களில் தரவுகளை சேமித்து வைப்பது எளிதான வேலை ஆகிறது. மைக்ரோசாப்ட் நிறுவனம் எழுத்து தவறுகளை சரிசெய்வதற்கு பத்து லட்சம் வார்த்தை அடங்கிய தரவுகளைத் தயாரித்தது. கூகுள் நிறுவனம் கோடிக் கணக்கான பக்கங்களை இணையத்தில் இணைத்து தேடி மொழி மாற்றங்களுக்கு வழிகாட்டியது. அமேசான் நிறுவனம் புத்தக மதிப்புரையாளர்களை கொண்டு புத்தகங்களை வாடிக்கையாளர்களுக்குக் கொண்டு சேர்த்தது. ஆனால் கோடிக்கணக்கான பரிவர்த்தனைகளை மேற்கொள்ளும் பொழுது அவை எளிமையாகவும். வாடிக்கையாளரை சென்று அடையவும் பெரிய தரவுகள் பெரிதும் உதவின.
கோடிக்கணக்கான பரிவர்த்தனைகள் மலிவான விலையில் மேற்கொள்ளப்பட்டாலும் அதன் விளைவுகளும் அதனால் பெற்ற முடிவுகளும் வியக்க வைக்கும் அளவில் இருந்தன. அதே நேரத்தில் தரவுகளை ஆய்வு செய்யும் பொழுது குறையில்லாமல் மிடுக்காக இருக்கும் வண்ணம் அவை தோன்றலாம். கூகுள் நிறுவனம் FLU TREND SERVICE என்ற காய்ச்சல் பற்றிய ஆய்வை மேற்கொண்ட போது தரவுகளின் அடிப்படையில் இரு மடங்கு நபர்கள் பாதிக்கப்படுவார்கள் என்று மதிப்பீடு செய்தது. சில நேரங்களில் இது போன்ற பொருட்களை இணைத்துப் பார்க்கும் தன்மையும் அறிவுபூர்வமான செயல்பாடுகளும் தரவுகளைப் பயன்படுத்திக் காணும் விடைகளுக்கு பாதகமாகவே இருக்கும். ஏனென்றால்,ஒவ்வொருவரின் தனிநபர் தேவையை பற்றி ஆய்வு செய்யாமல் தரவுகள் உணர்வுகளுக்கு எதிர்மாறான அடிப்படையில் விடைகளைத் தரும்.
தனிநபர் நடத்தைப் பற்றியும் குற்றவியல் விடுப்பு முதலானவை பற்றியும் மிகவும் விரிவாக எடுத்துக் கூறப்பட்டுள்ளது. நீதி என்பது தனிமனிதனுக்கு வழங்கப்படுவது, தரவுகளின் அடிப்படையில் வீதிகள் பாதுகாப்பாக இருப்பதற்கு அவைகளுக்கு நாம் நன்றி சொல்ல வேண்டும். மூன்று ஆண்டுகளாக தொடர்ந்து முன்னேறி கொண்டிருக்கும் பெரிய தரவுகள் என்ற தலைப்பை பற்றி இந்த புத்தகம் விரிவாகக் கூறுவதுடன், எதிர்காலத்தில் அவை எவ்வாறு அமையும் என்பதையும் எடுத்துக்கூறுகிறது.
rvenkatapathy@rediffmail.com