Brief Discussion of AWS Machine Learning Specialty Exam

·

2 min read

Brief Discussion of 
AWS Machine Learning Specialty Exam

AWSမှာလက်ရှိဖြေဆိုလို့ရတဲ့ Exam၁၂ခုရှိတဲ့အထဲမှာ အရင်ကဆို AIနဲ့ပတ်သက်တာဆိုလို့ ရှားရှားပါးပါး Specialty Categoryထဲက Machine Learning Specialty တခုပဲရှိတာကနေ အခုဆို Foundational နဲ့Associate category ထဲမှာပါ AI Practitioner ၊Machine Learning Engineer Associateဆိုပြီး Examနှစ်ခု အသစ်တိုးလာပါတယ်။ဒါပေမဲ့ အခုမှ Betaပဲရှိသေးတုန်းဆိုတော့ Examကလက်ရှိအသုံးချနေတဲ့နည်းပညာတွေနဲ့ဘယ်လောက်အတွဲမိတယ်ဆိုတာ ပြောဖို့ခက်ပါသေးတယ်။ဒီဆောင်းပါးမှာတော့ ဖြေလို့ရတာလည်းနည်းနည်းကြာနေပြီး Companyတော်တော်များများ အသိမှတ်ပြုခံထားရတဲ့ Machine Learning Specialty examနဲ့ပတ်သက်ပြီး အနည်းငယ်ဆွေးနွေးချင်ပါတယ်။

၁။ ဘယ်သူတွေဖြေသင့်လဲ။

လက်ရှိမှာ Data Scienceပိုင်းမှာလုပ်နေတဲ့သူတွေ ဒါမှမဟုတ် AWS Cloud Platform ပေါ်မှာ Machine Learning နဲ့ပတ်သက်တဲ့ developတာတွေ architecture ဆောက်တာတွေ modelတွေrunနေတာတွေနဲ့ တနှစ်ကျော်ကျော်ဝန်းကျင်လောက်အသားကျနေတဲ့သူတွေဆိုရင်တော့ ကိုယ့်portfolio လေးပိုပြီး strongဖြစ်သွားအောင်ဖြေထားသင့်တဲ့ certificate တခုဆိုရင် မမှားပါဘူး။

၂။ မေးခွန်းပုံစံကဘယ်လိုလဲ။

Business logicအခြေပြုထားတဲ့ Machine Learning modelတွေကို AWSရဲ့serviceတွေသုံးပြီး ဘယ်ဟာက အကောင်းဆုံးအဖြေလဲဆိုတာ စဉ်းစားခိုင်းတာမျိုးပါ။အကောင်းဆုံးအဖြေဆိုတာ ယေဘုယျအားဖြင့် Cost-Performance trade off ပါပဲ ။ တချို့နေရာတွေမှာ မေးခွန်းအသွားအလာအရ Costကိုဉီးစားပေးပြီး အဖြေထုတ်ရတာရှိသလို တချို့နေရာတွေမှာကျ Performance ကိုမဖြစ်မနေဉီးစားပေးရတာမျိုးပေါ့။ ဒါဆို တွက်တာချက်တာတွေ ကိုယ့်ထင်မြင်ချက်ရေးသားရတာမျိုးတွေ ပါမှာလား? No ပါ။လုံးဝလုံးဝ မပါပါဘူး။ Response typeက Multiple Choice: လေးခုထဲက မှန်တာ တခုရွေး Multiple response: ငါးခု သို့ ငါးခုထက်ပိုသော အဖြေတွေထဲက နှစ်ခု ဒါမှမဟုတ်နှစ်ခုထက်ပိုတာရွေး ဆိုပြီး ပေးထားတဲ့အဖြေထဲက အသင့်လျော်ဆုံးဟာကို ရွေးထုတ်ရမှာပါ။

၃။ဘယ်လိုဆိုအောင်မှာလဲ။

မေးခွန်း၆၅ပုဒ် ဖြေဆိုရမှာဖြစ်ပြီး အမှတ်ပြည့်၁၀၀၀မှာ ၇၅၀ရရင်အောင်တယ်ဆိုပေမဲ့ အမှတ်မယူတဲ့ ၁၅ပုဒ်လည်းရှိသေးတော့ သုံးချက်တွက်နည်းနဲ့ စဉ်းစားကြည့်မယ်ဆိုလို့ရှိရင် ၃၈ပုဒ် မှန်ရင်အောင်ပြီလို့ ဆိုနိုင်ပါတယ်။

၄။ ဘာတွေမေးမှာလဲ

မေးခွန်းပုံစံကတော့ အောက်ပါအတိုင်း Domain ၄မျိူးခွဲထားပါတယ်။

Domain 1 : Data Engineering

Machine Learning modelဆောက်ဖို့အတွက်လိုအပ်တဲ့ဒေတာစုဆောင်းတာအတွက်ပြင်ဆင်ပေးရတာမျိုးပါ ဉပမာ customerဆီကလာတဲ့ Data typeတွေကိုဘယ်လိုသိမ်းမလဲ ML modelဆောက်ဖို့အတွက် ဘယ် data typeကိုပြောင်းသင့်လဲ ဒီလို taskတွေကို AWSရဲ့ဘယ်လိုserviceတွေခေါ်သုံးမလဲ (ဉပမာ AWS Glue၊S3၊Apache Sparkစသည်ဖြင့်)

Domain 2: Exploratory Data Analysis

ML model အတွကိသုံးမဲ့ dataတွေကို clean dataဖြစ်အောင်လုပ်ပေးရတဲ့အပိုင်းပေါ့။ missing dataတွေ corruptedဖြစ်နေတာတွေကို ပြင်ဆင်ရတာတို့ Modelအလိုက်normalization, augmentation, scaling, data labeling လုပ်ပေးရတာမျိုးတွေရယ် အဆုံးသတ်မှာ ကိုယ်လိုချင်တဲ့ business requirement ပေါ်မူတည်ပြီး binning, one-hot encoding, outlier အစရှိတဲ့ Feature Engineeringဘယ်လိုလုပ်မလဲဆိုတာတွေမေးပါတယ်။AWS serviceတွေထဲက Amazon Athena Amazon Quicksight, SageMaker Ground Truthတို့ကို လေ့လာထားရင် ကောင်းကောင်းကျော်ဖြတ်နိုင်မယ့် Domainတခုပါ။

Domain 3: Modeling

ဒီအပိုင်းကတော့ MLနဲ့ပတ်သက်ပြီး တော်တော်လေးပြည့်ပြည့်စုံစုံသိထားမှ အဆင်ပြေမယ်ထင်ပါတယ်။ဖြေရှင်းရမယ့်ပြဿနာအပေါ်မူတည်ပြီး MLကတကယ်လိုတာရောဟုတ်ရဲ့လားဆိုတဲ့မေးခွန်းတွေ လိုလာခဲ့ရင်ရော Supervised Learningလား ၊Unsupervised Learningလားကွဲကွဲပြားပြားသိထားသင့်ပြီး foundation modelတွေကို classification regression forecasting clustering recommendation စသည်ဖြင့် မှန်ကန်စွာရွေးတတ်ဖို့လိုပါလိမ့်မယ်။

datasetကို trainingရယ် validationရယ်အတွက်ဘယ်လိုခွဲမလဲ Gradient Descent၊loss function ၊convergerceအစရှိတဲ့ optimization technique တွေထဲကဘယ်ဟာရွေးသင့်လဲ၊business logicအလိုက် သုံးထားရတဲ့algorithmတွေပေါ်မူတည်ပြီး GPUသုံးမလား CPUသုံးမလား၊dataကို real timeအတွက်runမှာလား၊Batchခွဲပြီးrunမှာလား အစရှိတဲ့ ခေါင်းခြောက်စရာတွေရယ်

အပေါ်ကအချက်တွေ အားလုံးပြင်ဆင်ပြီးပြီဆိုရင်တော့ parameter tuningနဲ့Evaluation အတွက်စဉ်းစားရပါတယ်။parameter tuningအတွက်ဆို ဒီmodelမှာ regularizationထည့်ရမှာလား၊ cross-validation သုံးသင့်လား၊ Neural Neworkဆိုရင်ရော layer ဘယ်နှစ်လွှာ nodeဘယ်နှစ်ခုထည့်မှာလဲ၊ learning rateရော အတိုးအလျော့ ဘယ်လိုလုပ်ရမလဲ၊Decision Tree, Random Forest, Gradient Boosting အစရှိတဲ့Tree-based modelတွေသုံးရင် ပိုပြီးထိရောက်မှုရှိနိုင်လား၊ အစရှိတာတွေနဲ့ပတ်သက်တဲ့မေးခွန်းမျိုးတွေလာလေ့ရှိပါတယ်။

modelကြီးတခုလုံး trainပြီးသွားပြီးဆိုရင်တော့ လုပ်ကိုလုပ်သင့်တဲ့evaluation အပိုင်းမှာက overfitting underfittingနဲ့ပတ်သက်တဲ့ bias varianceစစ်တာတို့ accuracy, precision, recall, AUC, ROCအစရှိတဲ့ metricsတွေevaluateလုပ်တာတို့အပြင် offline testing , online testing နဲ့ပတ်သက်တာတွေ trainထားတဲ့ modelsတွေ အများကြီးကိုmetrics comparasionလုပ်ပြီး အကောင်းဆုံးဟာရွေးထုတ်တာတွေလာတတ်ပါတယ်။

Domain 4: Machine Learning Implementation and Operations

ဒီအပိုင်းကတော့ ML conceptထက် AWS serviceကိုအသားပေးမေးလေ့ရှိပါတယ်။ CloudTrail ,CloudWatch သုံးပြီး modelရဲ့logတွေ ဘယ်လိုဖတ်မလဲ၊ ကိုယ့်modelကို AWS regionတွေAZတွေမှာ Auto-Scalingဘယ်လိုလုပ်ပြီး deployမလဲ၊Dockerထဲ ဘယ်လိုထည့်မလဲ၊ ကိုယ့်modelနဲ့အဆင်ပြေတဲ့ instanceတွေဘယ်လိုရွေးမလဲ၊ အစရှိတဲ့ ML solutionတခုရဖို့ လိုအပ်တဲ့taskတွေ စဉ်းစားမှာဖြစ်သလို AWS SageMaker ရဲ့algorithmတွေ Amazon Comprehend, Amazon Translateအစရှိတဲ့ AWS High-level services တွေကို အသေးစိတ်သိထားဖို့လည်း လိုအပ်ပါတယ်။

အကျဉ်းချုပ်ရမယ်ဆိုရင် ဒီcertificateက ခေတ်စားနေတဲ့ML careerတခုအတွက် ၁၀၀%အာမခံ မဟုတ်ပေမဲ့ examလေ့လာရင်း ရလာမဲ့ knowledge တွေ information တွေက နောက်တက်မဲ့လှေကားထစ်အတွက် အတိုင်းအတာတခုထိ သက်ရောက်မှုရှိမှာဖြစ်လို့ ဖြေထားတာမမှားတဲ့ certificate တခုလို့ထင်မိပါတယ်။ နောက်ဆောင်းပါးတွေမှာတော့ ဒီစာမေးပွဲအတွက် အချိန်ဘယ်လောက်ယူသင့်လဲ ဘယ်လိုပြင်ဆင်ရမလဲဆိုတာကို အသေးစိတ်ဆွေးနွေးသွားပါ့မယ်။

Ref : [https://d1.awsstatic.com/training-and-certification/docs-ml/AWS-Certified-Machine-Learning-Specialty\_Exam-Guide.pdf](https://d1.awsstatic.com/training-and-certification/docs-ml/AWS-Certified-Machine-Learning-Specialty_Exam-Guide.pdf)](https://d1.awsstatic.com/training-and-certification/docs-ml/AWS-Certified-Machine-Learning-Specialty/_Exam-Guide.pdf)