ML နှင့် DL ဆိုတာဘာလဲ။
AI ကိုသိပြီး၊ ML နှင့် DL ဆိုတာတွေကို မသိသေးရင်၊ AI အကြောင်းကို မသိသေးဘူး။
Digital ခေတ်မှာ Phone ကို FaceID နှင့် ဖွင့်တာကစလို့၊ ChatGPT ကို “တစ်နေ့ ရေဘယ်နှစ်လီတာ သောက်ရမလဲ။” ဆိုတဲ့မေးခွန်းအဆုံး နေ့စဉ် AI နှင့် ထိတွေ့နေကြတာ အထူးအဆန်းမဟုတ်တော့ဘူး။ သို့ပေမယ့် AI ဆိုတာကိုသိပြီးတော့ Machine Learning (ML) နှင့် Deep Learning (DL) အကြောင်းတွေကို ကွဲကွဲပြားပြား မသိဘူး၊ သိပြီးလည်း ဇဝေဇဝါဖြစ်နေတယ်၊ မရှင်းမလင်းဖြစ်နေတယ်ဆိုရင် AI အကြောင်းကို တကယ်မသိသေးလို့ပါ။
Machine Learning (ML) ဆိုတာဘာလဲ။
ML ဆိုတာ Data တွေကနေ သင်ယူထားတဲ့ Pattern နှင့် Relationship တွေပေါ်မူတည်ပြီးတော့ ဆုံးဖြတ်ချက်တွေ၊ ခန့်မှန်းတာတွေကို လုပ်ဆောင်နိုင်တဲ့ AI အမျိုးအစားတစ်ခုဖြစ်တယ်။ ML မှာ ပုံသေသတ်မှတ်ထားတဲ့ Rule (Traditional Programming ၏ if/else အလားတူ) တွေမရှိပဲနှင့်၊ လုပ်ဆောင်မှုကြောင့်ရလာတဲ့ Math (သို့မဟုတ်) Statistics အဖြေတွေကနေ Rule တွေကို သင်ယူတယ်။ ML ကို Train ဖို့ဆိုရင် Structure Data တွေကို အသုံးပြုရတယ်။ Structure Data ဆိုတာ Spreadsheet တွေ၊ Database တွေထဲက Data တွေဖြစ်ပြီးတော့၊ JSON နှင့် XML ကဲ့သို့သော Exchange လုပ်ဖို့အသုံးပြုတဲ့ Data တွေဆိုရင်တော့ CSV ပုံစံကိုပြောင်းလဲပြီးမှသာ ML အတွက်အသုံးပြုနိုင်တယ်။ ။ ML ရဲ့ Algorithm တွေမှာ Math Formula တွေနှင့် Statistics Method တွေကို အသုံးပြုတယ် (ဥပမာ Probability နှင့် Linear Regression)။ ဒါကြောင့်မို့ Mathematical ၊ Quantitative Analysis နှင့် Programming ဘာသာရပ်တွေက AI Engineer တစ်ယောက်မှာရှိရမယ့် အဓိက Skill တွေအဖြစ်သတ်မှတ်တယ်။ Dataset တစ်ခုနှင့် ML Program တစ်ခုကို Train ပြီးသွားလို့ ရလာတဲ့ Software ကို Model လို့ခေါ်တယ်။ Model ထဲကို Data အသစ်တစ်ခု Input လုပ်ပြီးတော့ ခန့်မှန်းမှုတစ်ခု လုပ်ဆောင်ခိုင်းရင် ၄င်း Model ကသင်ယူခဲ့တဲ့ Data တွေရဲ့ Pattern နှင့် Relationship တွေပေါ်မှာအခြေခံပြီး ဆုံးဖြတ်မှုတစ်ခုပြုလုပ်ပေးတယ်၊ Output ထုတ်ပေးတယ်။ ML အသုံးပြုထားတဲ့ Feature တွေကို ပေါ်ပြူလာ Application တွေမှာတွေ့နိုင်ပါတယ်။ ဥပမာ Netflix မှာဆိုရင် User ကြည့်ရှုလေ့ရှိတဲ့ ရုပ်ရှင်၊ ဇာတ်ကားပုံစံ၊ အမျိုးအစားတွေပေါ်မူတည်ပြီးတော့ နောက်ထပ်ကြည့်ရှုသင့်တဲ့ ရုပ်ရှင်၊ ဇာတ်ကားတွကို Rating အလိုက် ဇာတ်လမ်းအမျိုးအစားအလိုက် Home Page မှာဖေါ်ပြနိုင်ဖို့အတွက် ML ကိုအသုံးပြုပြီး လုပ်ဆောင်ထားတာဖြစ်တယ်။
Deep Learning (DL) ဆိုတာဘာလဲ။
DL ဆိုတာ Traditional ML ထက်ပိုပြီးတော့ Powerful ဖြစ်တဲ့ Advanced ML အမျိုးအစားတစ်ခုဖြစ်တယ်။ DL မှာ Neural Network Layer တွေကို အသုံးပြုထားတယ်။ Neural Network ဆိုတာ လူရဲ့ဦးနှောက်ထဲမှာအလုပ်လုပ်တဲ့ Neuron တွေရဲ့ပုံစံကို နမူနာယူပြီးဖန်တီးထားတာဖြစ်တယ်။ DL ရဲ့ အဓိကအုတ်မြစ် Algorithm က Artificial Neural Networks (ANN) ဖြစ်တယ်။
ဦးနှောက်ထဲမှာရှိတဲ့ Neuron တွေမှာ Soma (Neuron တစ်ခုရဲ့ အဓိကအစိတ်အပိုင်း) ၊ Dendrite (အခြား Neuron တွေ ၊ Tissue တွေဆီက Signal တွေကိုလက်ခံတဲ့ အစိတ်အပိုင်း) ၊ Axon (အခြား Neuron တွေ ၊ Tissue တွေဆီကို Signal တွေပေးပို့တဲ့ အစိတ်အပိုင်း) နှင့် Synapse (Neuron တစ်ခုနှင့်တစ်ခုဆုံတဲ့နေရာ၊ ၄င်းနေရာကနေ Neuron တစ်ခုနှင့်တစ်ခု ဆက်သွယ်ပြီးတော့ Signal တွေပေးပို့တဲ့ အစိတ်အပိုင်း) ဆိုပြီးရှိတယ်၊ ၄င်းပုံစံကို အတုယူပြီး ANN ထဲမှာလည်း Neuron ၊ Input ၊ Output နှင့် Weight ဆိုပြီး အပိုင်း (၄)ပိုင်းနှင့် ဖန်တီးထားတယ်။
DL နှင့် လူရဲ့ဦးနှောက် မတူတဲ့အချက်တွေကတော့ DL က Digital Version ဖြစ်ပြီးတော့၊ Data တွေကနေသင်ယူတယ်၊ နောက်ထပ်ရရှိလာတဲ့ Experience တွေက Pattern နှင့် Relationship အသစ်တွေကို လက်ခံထားတယ်။
Neuron တွေချိတ်ဆက်ထားတဲ့ Network တစ်ခုမှာ Input Layer ၊ Hidden Layer နှင့် Output Layer ဆိုပြီးတော့ အဓိက Layer (၃)ခုရှိတယ်။ Input Layer က Raw Data ကိုလက်ခံတဲ့အပိုင်းဖြစ်ပြီး၊ Hidden Layer က ထည့်သွင်းလိုက်တဲ့ Data ရဲ့ ပုံသဏ္ဍာန်နှင့် ဖွဲ့စည်းပုံပေါ်မူတည်ပြီးတော့ ၄င်း Layer ထဲက Neuron တစ်ခုချင်းစီမှာ Process လုပ်တယ်၊ (ဥပမာ Hidden Layer 1 က Shape ကို Learn လုပ်ရင်၊ Hidden Layer 2 က eye နှင့် ear ကို Learn လုပ်တယ်။ Neuron တွေ က Image မှာရှိတဲ့အစိတ်အပိုင်းတွေရဲ့ Pixel အရေအတွက်နှင့် Weight တွေကိုတွက်ချက်ပြီး Learn လုပ်တယ်။) တွက်ချက်မှုတွေလုပ်ပြီးတာနှင့် ဖြစ်နိုင်တဲ့ အဖြေတစ်ခုကို Output Layer ကနေ ထုတ်ပေးတယ်။ ဒါကြောင့်မို့ AI ကထွက်လာတဲ့ အဖြေတိုင်းဟာ ၁၀၀% မှန်ကန်မှုရှိမနေပဲ၊ ၉၀% လောက်မှန်ကန်နေရင်တော့ အလွန်ကောင်းမွန်တဲ့ AI Model တစ်ခုလို့ပြောနိုင်တယ်။
DL နှင့် Traditional ML မတူတဲ့အချက်က DL အတွက် Train ဖို့ Data တွေကို Structure Data နှင့် Unstructure Data နှစ်မျိုးစလုံးကို အသုံးပြုနိုင်ခြင်းဖြစ်တယ်။ Unstructured Data ဆိုတာ PDF နှင့် Text ကဲ့သို့သော File တွေ ၊ Image နှင့် Photo File တွေ ၊ Audio နှင့် Video File တွေ စသည်တို့ဖြစ်တယ်။ Unstructured Data တွေမှာ မတူညီတဲ့ပုံသဏ္ဍာန်နှင့် မတူညီတဲ့ ဖွဲ့စည်းပုံတွေရှိတယ်။ (ဥပမာ Image တွေမှာ Shape နှင့် Pixel တွေရှိခြင်း ၊ Text တွေကို Language နှင့် Context အတွက်အသုံးပြုခြင်း ၊ Audio တွေမှာ Wave နှင့် Frequency ရှိခြင်း)။ စသည်ဖြင့် မတူညီတဲ့ Data တွေကြောင့် DL Model သည်လည်း အမျိုးအစားတွေကွဲပြားသွားတယ်။ အဲ့ဒါကြောင့် Image တွေ Video တွေနှင့်ပတ်သက်ရင် CNN (Convolutional Neural Networks) ကိုအသုံးပြုပြီး၊ Text တွေ၊ Speech (Audio) တွေ ၊ Music တွေနှင့်ပတ်သက်ရင် RNN (Recurrent Neural Networks) ကိုအသုံးပြုတယ်။ Sentences (Text) တွေ၊ Context တွေ၊ Data တွေရဲ့ ချိတ်ဆက်ပုံတွေနှင့် ပတ်သက်ရင် Self-Attention Mechanisms နှင့် Feedforward Layers ကိုအသုံးပြုထားတဲ့ Transformer ကို အသုံးပြုတယ်။ DL Model တွေအကုန်လုံးမှာ Data တွေရဲ့ Pattern နှင့် Relationship တွေကိုသင်ယူဖို့ အဓိကအသုံးပြုထားတာကတော့ Neural Networks ဖြစ်တယ်။ DL Model တွေမှာ လူတွေအသုံးပြုတဲ့ ဘာသာစကားကိုနားလည်ဖို့ Natural Language Processing (NLP) ဆိုတာပါဝင်တယ်၊ DL အတွက် နောက်ထပ်အရေးပါတဲ့ အစိတ်အပိုင်းတစ်ခုလည်းဖြစ်တယ်။
DL Model တွေထဲမှာ ပေါ်ပြူလာအဖြစ်ဆုံးက Transformer ဖြစ်ပြီးတော့ Large Language Model (LLM) အတွက်အသုံးပြုထားတဲ့ Model တစ်ခုလည်းဖြစ်တယ်။
(ဥပမာဆိုရင် ChatGPT ၊ Gemini နှင့် Claude စသည့် Chatbot တွေကို LLM အသုံးပြုပြီး Develop လုပ်ထားတာဖြစ်တယ်။)
Large Language Model (LLM) ဆိုတာဘာလဲ။
LLM ဆိုတာ Transformer နှင့် Advanced NLP ကိုအသုံးပြုထားတဲ့ AI Model တစ်ခုတယ်။ LLM အတွက် Data တွေကို စာအုပ်တွေ၊ Website တွေ၊ ဆောင်းပါးတွေ စသည်ဖြင့် နေရာမျိုးစုံကနေ စုစည်းပြီး၊ ထရီလီယံနှင့်ချီတဲ့ (Trillion) Data တွေနှင့်အသုံးပြုပြီး Train ထားတဲ့ AI Model တစ်ခုဖြစ်တယ်။ ဒါကြောင့်လည်း မေးသမျှ မေးခွန်းတွေကို ဖြေနိုင်တာ၊ ဆက်စပ်အကြောင်းအရာတွေကို နားလည်နေတာ၊ လူတစ်ယောက်ကဲ့သို့ ပြန်လည်ပြောဆိုနိုင်တာဖြစ်တယ်။
အနှစ်ချုပ်အနေနှင့် ပြောရရင် AI ဆိုတာ အထက်မှာဖေါ်ပြခဲ့တဲ့ ML ၊ DL ၊ ANN ၊ NLP ၊ LLM အားလုံးအတွက် ခေါ်ဝေါ်တဲ့ Umbrella Term တစ်ခုသာဖြစ်ပါတယ်။
Ref:
Deep learning vs machine learning vs AI. (n.d.). Google Cloud
B.S, Class Notes of Artificial Intelligent (2025)







