Unlock Skill Data Science & Visualization with Python

Programming & Coding

หลักสูตร Unlock Skill Data Science & Visualization with Python

อาชีพนักวิทยาศาสตร์ข้อมูล (Data Scientist) เคยถูกขนานนามจากนิตยสาร HBR (Harvard Business Review) ว่า “เป็นอาชีพที่เซ็กซี่ที่สุดในศตวรรษที่ 21” เพราะเป็นสายงานอาชีพที่กำลังเป็นที่ต้องการของใครหลาย ๆ คน สายงาน Data Science ก็เป็นหนึ่งในนั้น มีทั้งทักษะที่เป็นที่ต้องการของตลาด อีกทั้งค่าตัวสูง แต่การที่เราจะก้าวไปสู่งานสาย Data Science ได้นั้น จำเป็นที่จะต้องปูพื้นฐานและทำความเข้าใจเกี่ยวกับสายงานนี้ให้ดีเสียก่อน หลักสูตรนี้จะพาผู้เรียนมาปลดล็อกทักษะพื้นฐานงาน Data Science ที่ใช้ Python ในการพัฒนาโปรแกรม เริ่มตั้งแต่การปูพื้นฐานการใช้งานไลบรารี NumPy Pandas ซึ่งเป็นไลบรารีสำคัญในเรื่องของการจัดการข้อมูล อีกทั้งการนำข้อมูลมาตีความ วิเคราะห์ และแสดงผลในรูปแบบ Data Visualization ที่หลากหลายด้วยไลบรารี Matplotlib และ Seaborn เสริมเรื่องเทคนิคการทำความสะอาดข้อมูลและวิธีการจัดการกับข้อมูลสูญหาย เป็นต้น

ด้วยการอบรมที่มุ่งเน้นให้ผู้รับการอบรมได้ฝึกการคิด ฝึกการแก้ปัญหา ฝึกทักษะลงมือปฏิบัติจริง และดำเนินการอบรมโดยวิทยากรผู้ชำนาญในด้านการพัฒนาโปรแกรม ดังนั้นผู้รับการอบรมจะสามารถเก็บเกี่ยวความรู้ ประสบการณ์ เทคนิคต่าง ๆ มากมายโดยตรงได้จากวิทยากร และมีแนวคิดที่ถูกต้องเพื่อต่อยอดในการพัฒนางานจริงหลากหลายด้าน ด้วยภาษา Python ต่อไป

ระยะเวลา 12 ชั่วโมง

อบรม 2 วัน | 9.00 น. - 16.00 น.

ระดับ Intermediate

ระดับความรู้ขั้นปานกลาง


ราคา

7,900 บาท

เนื้อหาการอบรม

  • ทำความเข้าใจกับงาน Data Science
    • Data Science คืออะไร
    • กระบวนการของงาน Data Science
    • แนะนำเครื่องมือที่ใช้ในงาน Data Science
    • แนะนำภาษาโปรแกรม Python
  • การใช้งานภาษา Python สำหรับงาน Data Science
    • เรียนรู้หลักทางภาษาไวยากรณ์ของ Python เบื้องต้น
    • การใช้งานโปรแกรมย่อย Lambda
    • การใช้งานไลบรารี NumPy
  • การจัดการข้อมูลด้วย Pandas
    • Pandas คืออะไร
    • โครงสร้างข้อมูลแบบ Series
    • โครงสร้างข้อมูลแบบ DataFrame
    • การอ่าน แก้ไขและบันทึกไฟล์ข้อมูล CSV
    • การอ่าน แก้ไขและบันทึกไฟล์ข้อมูล Excel
    • การคำนวณสถิติเบื้องต้นด้วย Pandas
    • การ Pivot Table ด้วย Pandas
  • การสร้าง นำเสนอ และตีความแผนภาพข้อมูล (Data Visualization) ด้วยไลบรารี Matplotlib
    • การพล็อตกราฟแท่ง
    • การบันทึกภาพกราฟเป็นไฟล์ (.png .jpg .pdf)
    • การพล็อตกราฟเส้น
    • การพล็อตกราฟวงกลม
    • การพล็อตกราฟ Scatter
    • การพล็อตกราฟ Histogram
    • การพล็อต Boxplot
    • การกำหนดรายละเอียดกราฟของ matplotlib
  • การสร้าง นำเสนอ และตีความแผนภาพข้อมูล (Data Visualization) ด้วยไลบรารี Seaborn
    • การใช้ฟังก์ชันเตรียมข้อมูล (Datasets) ใน Seaborn
    • การพล็อตกราฟ Distplot
    • การพล็อตกราฟ Joinplot
    • การพล็อตกราฟ Pairplot
    • การพล็อตกราฟ Rugplot
    • การพล็อตกราฟ KDE Plot
    • การพล็อตกราฟ Count Plot
    • การพล็อตกราฟ Violinplot
    • การพล็อตกราฟ Stripplot
    • การพล็อตกราฟ Swarmplot
    • การพล็อต Heatmap
    • การพล็อต Clustermap
  • การจัดการข้อมูลสูญหาย (Missing Data)
    • ข้อมูลสูญหาย คืออะไร
    • ประเภทของข้อมูลสูญหาย
    • วิธีการจัดการกับข้อมูลสูญหาย
  • การจัดระเบียบข้อมูล (Data Cleansing)
    • การโหลดข้อมูลและตรวจสอบเบื้องต้น
    • การลบแถว และคอลัมน์ที่ไม่ใช้
    • การเปลี่ยนชื่อคอลัมน์
    • การตรวจสอบความเหมาะสมของข้อมูลประเภท Category
    • การจัดการกับข้อมูลผิดชนิด
    • วิธีการคัดตัวเลขออกจาก Object/String
    • วิธีจัดการกับข้อมูลทศนิยม
    • วิธีการจัดการกับข้อมูลซ้ำ
  • ค่าผิดปกติ (Outlier) และวิธีการกำจัด
    • ค่าผิดปกติ คืออะไร
    • การหาค่าผิดปกติด้วยวิธี IQR
    • การกำจัดค่าผิดปกติด้วยวิธี Z-Score
  • ข้อมูลอนุกรมเวลา (Time Series Data)
    • อนุกรมเวลา คืออะไร
    • การกำหนดค่าให้อยู่ในรูป DatetimeIndex
  • การวิเคราะห์ข้อมูลและ การพยากรณ์ข้อมูล