“Data Scientist” หรือ “นักวิทยาศาสตร์ข้อมูล”

ในยุคดิจิทัล องค์กรไหนที่มี “Big Data” และสามารถ “วิเคราะห์-จัดการข้อมูล” ได้อย่างถูกต้อง แม่นยำ องค์กรนั้นย่อมมีความได้เปรียบในการแข่งขัน

เมื่อ “Big Data” ยิ่งทวีความสำคัญมากขึ้นเรื่อยๆ นี่จึงทำให้สายอาชีพ “Data Scientist” หรือ “นักวิทยาศาสตร์ข้อมูล” ผู้ทำหน้าที่ในการตีความ หรือวิเคราะห์ และจัดการข้อมูลขนาดใหญ่ กำลังเป็นตำแหน่งงานที่มาแรงในยุคดิจิทัล และเป็นที่ต้องการของตลาดงานทั่วโลก รวมถึงในประเทศไทยด้วยเช่นกัน แต่ขณะนี้พบว่าคนทำงานในสายงานนี้ยังมีน้อย สวนทางกับความต้องการของตลาดงาน ที่องค์กรทั่วโลก ไม่ว่าจะภาครัฐ และเอกชนต่างต้องการบุคลากรด้านนี้โดยเฉพาะ

หลายคนอาจสงสัยว่า “Data Scientist” ทำอะไร และทำไมถึงได้รับความสนใจทั้งจากภาครัฐ และภาคเอกชน ถ้าหากต้องการเป็น “Data Scientist” ควรมีการเตรียมตัวอย่างไร ?!? ต่อคำถามต่างๆ เหล่านี้ ศูนย์วิจัยเศรษฐกิจและธุรกิจ ธนาคารไทยพาณิชย์ (SCB EIC) ได้เจาะลึกอาชีพ “Data Scientist” ไว้อย่างสนใจดังนี้

เผยตัวตน Data Scientist

ในยุคเศรษฐกิจดิจิทัล “Big Data” หรือ “ข้อมูลขนาดใหญ่” ได้กลายเป็นทรัพยากรที่มีค่าประหนึ่งน้ำมันดิบ เพราะเป็นอีกหนึ่งกลไกสำคัญขององค์กรทั้งภาคธุรกิจและรัฐบาลในยุคปัจจุบัน เนื่องจาก “ข้อมูลขนาดใหญ่” เป็นสิ่งที่รวบรวมพฤติกรรม รสนิยม รวมถึงความคิดเห็นของผู้คนบนโลกต่อสิ่งรอบตัวต่างๆ แทบทุกกิจกรรมที่เราทำในหนึ่งวัน กลายเป็นข้อมูลที่นำไปใช้ต่อได้ ไม่ว่าจะเป็นการต่อยอดทางธุรกิจเพื่อสร้างสินค้าและบริการให้เข้าถึงกลุ่มผู้บริโภคเป้าหมายได้มากขึ้น หรือนำไปใช้เพื่อออกแบบนโยบายภาครัฐให้เข้ากับความต้องการของประชาชน

อย่างไรก็ตาม ข้อมูลจำนวนมหาศาลนี้ ไม่สามารถนำมาปรับใช้ได้ในทันที ด้วยขนาด ความเร็ว และความหลากหลายของข้อมูล ทำให้องค์กรต้องการคนที่สามารถทำความเข้าใจข้อมูลและดึงแก่นสำคัญออกมาใช้ได้ ซึ่ง “Data Scientist” คือ ผู้ที่จะเข้ามาจัดการกับข้อมูลเหล่านี้

ถ้าเปรียบเทียบ “Big Data” เป็นน้ำมันดิบ “Data Scientist” ก็คือวิศวกรปิโตรเลียมที่ค้นหา และกลั่นกรององค์ความรู้จากข้อมูลขนาดใหญ่ไปให้องค์กรประยุกต์ใช้ในการดำเนินกิจการ โดย “Data Scientist” หรือ “นักวิทยาศาสตร์ข้อมูล” ทำหน้าที่เป็นตัวกลางเชื่อมระหว่างโจทย์ของผู้บริหารองค์กรกับข้อมูลที่มีอยู่ เพื่อให้ได้มาซึ่งทางออกที่มีประสิทธิภาพที่สุด จากการนำ Big Data มาทำให้เป็น Information เพื่อนำ ไปวิเคราะห์ให้เกิดเป็น Knowledge หรือความเข้าใจ และตกผลึกเป็นองค์ความรู้ ให้องค์กรนำไปต่อยอด

ล้วงลึกกระบวนการทำงานของ “Data Scientist”

แม้โจทย์ที่ได้รับจะหลากหลาย แต่กระบวนการคิดและการทำงานของ “Data Scientist” ล้วนมีพื้นฐานมาจากหลักการทางวิทยาศาสตร์ นี่จึงเป็นเหตุผลที่อาชีพนี้มีชื่อเรียกต่อท้ายเป็น นักวิทยาศาสตร์ หรือ scientist กระบวนการทำ งานหลักมีอยู่ 5 ขั้นตอนเริ่มจาก

1. การตั้งคำถามที่น่าสนใจ เป็นประโยชน์ต่อองค์กร และสามารถนำ เอาข้อมูลมาช่วยแก้ปัญหาได้
2. การค้นหาและจัดเก็บข้อมูล
3. การสำรวจข้อมูล หาแบบแผนความเชื่อมโยงระหว่างกัน
4. การสร้างแบบจำ ลองเพื่อวิเคราะห์ข้อมูล และ
5. การสื่อสารผลลัพธ์ที่ได้ให้เห็นภาพและเข้าใจง่าย

หลังจากนำเสนอผลลัพธ์แล้ว ภาครัฐหรือธุรกิจอาจตัดสินใจนำไปใช้ หรือปรับปรุงการวิเคราะห์เพิ่มเติม รวมไปถึงการสร้างนวัตกรรมที่ก่อให้เกิดประสิทธิภาพในองค์กรมากขึ้น เช่น Robotics (การใช้หุ่นยนต์) หรือ Automation (การนำ เครื่องจักรมาใช้แทนแรงงานคน) ซึ่งไม่ว่าผลลัพธ์สุดท้ายจะเป็นอย่างไร “Data Scientist” มักจะกลับมาเริ่มที่กระบวนการแรกคือการตั้งคำถามใหม่ๆ อีกครั้ง

และแม้ว่ากระบวนการทำงานจะเหมือนกับกระบวนการทางวิทยาศาสตร์ทั่วไป แต่ความแตกต่างที่สำคัญ คือ “Data Scientist” จะใช้ข้อมูลขนาดใหญ่ ทั้งข้อมูลที่มีโครงสร้าง (Structured data) และข้อมูลที่ไม่มีโครงสร้าง (Unstructured data) เพื่อหารูปแบบความสัมพันธ์ต่างๆ โดยใช้เครื่องมือ หรือแบบจำลองทางคณิตศาสตร์ และยังใช้ทักษะการเขียนโปรแกรมในการทำงานอีกด้วย

“Data Scientist” อาชีพเซ็กซี่ที่สุดแห่งศตวรรษ 21 – ประเทศไทย มีเพียง 200 คน

เมื่อข้อมูลและเทคโนโลยีก่อให้เกิดประโยชน์มหาศาล “Data Scientist” จึงกลายเป็นที่ต้องการขององค์กรทั่วโลก ในปี 2012 บทความใน “Harvard Business Review” กล่าวว่า Data Scientist คืองานที่เซ็กซี่ที่สุดในศตวรรษที่ 21 เพราะ Data Scientist เป็นบุคคลที่ใครๆ ต่างต้องการ แต่หาตัวได้ยาก

นอกจากนี้ข้อมูลของ indeed.com หนึ่งในเว็บไซต์หางานที่ได้รับความนิยมสูงสุดในสหรัฐฯ พบว่าความต้องการ “Data Scientist” ของบริษัทต่างๆ กำลังเพิ่มขึ้นอย่างรวดเร็ว ในช่วงปี 2014 – 2017 และ IBM ยังคาดการณ์ว่าความต้องการ Data Scientist จะเพิ่มขึ้นอีกประมาณ 39% ในช่วงปี 2015 – 2020

จากกระแสความต้องการตัว “Data Scientist” ในช่วงหลายปีที่ผ่านมา พิสูจน์ได้ว่าความเซ็กซี่ของงานนี้เป็นจริงและไม่ได้เป็นเพียงแนวโน้มระยะสั้น โดยในปี 2017 เว็บไซต์ค้นหางานชื่อดังอย่าง Glassdoor จัดอันดับ Data Scientist ให้เป็นอาชีพที่ดีที่สุดในสหรัฐฯ และเป็นอาชีพที่ดีที่สุดลำดับต้นๆ ของอังกฤษในปีเดียวกัน ซึ่งการจัดลำดับอ้างอิงมาจากปัจจัยด้านค่าแรง ความพึงพอใจในการทำ งาน และโอกาสในการทำงานในอนาคต

อย่างไรก็ตาม องค์กรต่างๆ ยังหาตัว Data Scientist เข้ามาทำงานได้ไม่ง่ายนัก ในรายงานของ MIT Sloan Management Review 43% ของบริษัทกลุ่มตัวอย่างในสหรัฐฯ รายงานว่าความท้าทายในปัจจุบันคือการที่บริษัทขาดทักษะด้านการวิเคราะห์ข้อมูลและการสืบค้นข้อมูล ซึ่งเป็นงานในส่วนที่เกี่ยวข้องกับ Data Scientist และไม่เพียงแค่หาคนเข้ามาทำงานยาก แต่การรักษาให้บุคลากรกลุ่มนี้ทำงานต่อกับบริษัทยังเป็นเรื่องท้าทายอีกเช่นกัน

นอกจากนี้ การจะหาผู้มีความรู้ใกล้เคียงแล้วผันตัวมาเป็น Data Scientist ก็ไม่ใช่เรื่องง่าย นักการศึกษาของ Wanted Analytics พบว่า มีเพียง 4% จากนักเขียนโปรแกรมคอมพิวเตอร์ในสหรัฐฯ กว่า 332,000 คนที่มีพื้นฐานและความรู้พร้อมที่จะเปลี่ยนมาเป็น Data Scientist

สำหรับประเทศไทย “EIC” เผยว่าอุปทานของ Data Scientist ในไทยยังมีอยู่ค่อนข้างน้อยเมื่อเทียบกับสหรัฐฯ จากการสืบค้นข้อมูลจาก LinkedIn พบว่าผู้ที่ระบุว่าตนเองทำงานเป็น Data Scientist ในไทยมีเพียง 200 บัญชี เทียบกับสหรัฐฯ ที่มี 44,000 บัญชี แม้ว่าตอนนี้มหาวิทยาลัยในไทยจะเริ่มเปิดหลักสูตรเฉพาะทางด้าน Data Science แต่ก็มีอยู่เพียงไม่กี่แห่งเท่านั้น และจำนวนนักศึกษาที่ผลิตได้ก็ยังมีอยู่น้อย

แต่คาดว่าความต้องการ Data Scientist ในตลาดแรงงานจะมีมากถึง 2,000 คน และมีอัตราเติบโตเฉลี่ยอยู่ที่ประมาณ 15% ในช่วง 2 – 3 ปีข้างหน้า เมื่อคำนวณจากขนาดของอุตสาหกรรมเทียบกับสหรัฐฯ และปรับตัวเลขให้เหมาะสมกับเศรษฐกิจของไทยซึ่งยังอยู่ในช่วงเริ่มต้นของการนำข้อมูลขนาดใหญ่มาใช้ประโยชน์

ปัจจุบัน บริษัทหลายแห่งในไทยเริ่มมีแพลตฟอร์มเพื่อเก็บข้อมูลของตัวเอง ทำให้ฐานข้อมูลมีขนาดใหญ่ขึ้น ในอนาคตอันใกล้จึงมีความเป็นไปได้สูงที่บริษัทต่างๆ ทั้งธุรกิจขนาดใหญ่ในหลายอุตสาหกรรม ตลอดจนธุรกิจ start-up และ SMEs ด้านเทคโนโลยี จะต้องการ Data Scientist มากขึ้นเพื่อสร้างองค์ความรู้จากข้อมูลขนาดใหญ่ที่มีอยู่ สิ่งที่จะเกิดขึ้นนี้ไม่ใช่แค่ในภาคเอกชนเท่านั้น หน่วยงานภาครัฐที่มีข้อมูลขนาดใหญ่ก็ต้องการตัว Data Scientist เข้ามาช่วยในการปรับปรุงนโยบายสาธารณะ ตลอดจนพัฒนาการตัดสินใจในด้านต่างๆ ให้รวดเร็วและมีประสิทธิภาพมากขึ้นเช่นกัน

บุคลากรยังขาดแคลน ค่าแรงจึงสูงกว่าอาชีพอื่น

ความต้องการที่สูง ตรงกันข้ามกับจำนวนแรงงานที่มีน้อย ทำให้ค่าแรงของ “Data Scientist” สูงกว่าอาชีพอื่นที่ลักษณะงานใกล้เคียงกัน โดยผู้ที่จบปริญญาตรีและทำงานเป็น Data Scientist ในสหรัฐฯ มีค่าแรงเฉลี่ยสูงกว่าค่าแรงเฉลี่ยของผู้ที่จบสาขาอื่น หรือแม้แต่สายอาชีพที่ใกล้เคียงกันและประสบการณ์ทำงานเท่ากัน Data Scientist ก็มีค่าแรงเฉลี่ยที่สูงกว่าอย่างน้อย 10%

“รายได้ที่สูง” เป็นอีกเหตุผลที่ทำให้คนที่เรียกตัวเองว่าเป็น Data Scientist มีจำนวนมากขึ้น รายงานของ LinkedIn พบว่า เกินกว่าครึ่งของคนที่แสดงตนเป็น Data Scientist เพิ่งจะมีการเพิ่มหรือเปลี่ยนคำนำหน้าอาชีพของตัวเองในช่วงไม่กี่ปีมานี้

และถึงแม้จำนวน (คนที่บอกว่าตัวเองเป็น) Data Scientist จะเพิ่มขึ้น แต่ก็ยังไม่พบสัญญาณว่าอาชีพนี้จะล้นตลาดแต่อย่างใด ในทางตรงข้ามนายจ้างยังใช้เวลาในการหาตัว Data Scientist มาทำงานนานกว่าหาบุคลากรในตำแหน่งอื่นโดยเฉลี่ย สิ่งเหล่านี้เป็นสัญญาณบอกว่าสายอาชีพนี้ยังคงเป็นที่ต้องการสูงและยังขาดแคลน

จะเป็น “Data Scientist” ต้องเรียนคณะอะไร ?!

ถึงตรงนี้ได้เห็นแล้วว่า “Data Scientist” เป็นสายอาชีพที่น่าสนใจ และยังมีองค์กรต้องการตัวสูงไปอีกหลายปี แต่ก่อนจะเข้าสู่เส้นทาง Data Scientist ต้องเตรียมความพร้อมอย่างไร มาดูกัน

– Data Scientist ส่วนใหญ่จบการศึกษาระดับปริญญาโทเป็นอย่างน้อย ด้วยความที่ Data Scientist เป็นอาชีพใหม่ในตลาดแรงงาน ทำให้การเรียนการสอนเฉพาะทางเพิ่งจะมีในช่วงมีในช่วงไม่กี่ปีมานี้ ดังนั้นคนที่ทำงานด้านนี้ จึงไม่ได้จำกัดว่าต้องจบหลักสูตรเฉพาะทาง หรือจบสาขาใดสายหนึ่งโดยเฉพาะ อย่างไรก็ตาม คนทำงานในสายอาชีพนี้ ควรมีความเข้าใจในหลักคณิตศาสตร์ขั้นสูง สามารถเข้าใจและจัดการข้อมูล ตลอดจนเขียนโปรแกรมต่างๆ ได้ดี ซึ่งการจะได้ทักษะในระดับดังกล่าว มักต้องผ่านการศึกษา และการฝึกฝนในระดับปริญญาโท หรือปริญญาเอก

ในสหรัฐฯ ผู้ที่ทำอาชีพ Data Scientist ส่วนใหญ่มีภูมิหลังด้านการศึกษาคณิตศาสตร์ สถิติ วิศวกรรมศาสตร์ วิทยาการคอมพิวเตอร์ วิทยาศาสตร์ และเศรษฐศาสตร์ 

ขณะที่ Data Scientist ในไทย มักจบการศึกษาจากคณะวิศวกรรมศาสตร์ คณิตศาสตร์ สารสนเทศข้อมูล (IT) และวิทยาการคอมพิวเตอร์

จะเห็นได้ว่าจบการศึกษาแตกต่างกัน แต่จุดร่วมของคณะการศึกษาเหล่านี้ คือ เป็นคณะที่สอนสถิติขั้นสูง และเขียนภาษาโปรแกรม เพื่อใช้ในการวิเคราะห์ข้อมูล

– คนจบปริญญาตรี ก็เป็น Data Scientist ได้ เพราะทักษะที่จำเป็นสามารถพัฒนาได้จากการเรียนคอร์สเฉพาะทาง หรือจากการฝึกงาน แม้หลายคนจะจบการศึกษาระดับสูง แต่ผู้ที่ทำงานเป็น Data Scientist ส่วนใหญ่ต่างตอบเป็นเสียงเดียวกันว่าสายอาชีพนี้ไม่จำเป็นต้องจบถึงปริญญาโท หรือปริญญาเอก บรรดา Data Scientist ในสหรัฐฯ เองก็เริ่มมีคนที่จบการศึกษาถึงปริญญาเอกน้อยลง เพราะทักษะที่จำเป็นสำหรับอาชีพนี้ สามารถหาได้จากการเรียนระดับปริญญาตรีและโท หรือจากการฝึกงานตำแหน่ง Data Scientist ในบริษัทใหญ่ๆ

นอกจากนี้ การเรียนจากคอร์สออนไลน์และค่ายฝึกทักษะต่างๆ (Boot camp) ก็ช่วยสอนทักษะที่จำเป็นสำหรับอาชีพนี้ได้เช่นกัน ดังนั้น การทำงานเป็น Data Scientist จึงไม่ได้มองหาคนที่จบการศึกษาระดับสูงเป็นหลัก แต่การมีทักษะที่เพียงพอหรือไม่นั้นเป็นสิ่งที่สำคัญมากกว่า

ในไทย Data Scientist ถือเป็นสายอาชีพใหม่ และยังแทบไม่มีการเรียนการสอนสาขานี้โดยตรง หลายคนจึงมองว่าคนที่จะเป็น Data Scientist ได้ต้องจบการศึกษาระดับสูงจากต่างประเทศ แต่จากการศึกษาของ “EIC” พบว่า 50% ของ Data Scientist ในไทยสามารถทำงานในสายอาชีพนี้ได้ แม้จบการศึกษาจากสถาบันในประเทศ

4 ทักษะที่ “Data Scientist” ต้องมี

นอกจากที่จะต้องมีความชื่นชอบในการทำ งานด้านข้อมูล ความใฝ่รู้ และความมุ่งมั่นในการทำ งานแล้ว ทักษะจำ เป็นสำหรับ Data Scientist สามารถแบ่งได้เป็น 2 แบบ คือ

1. ทักษะในเชิงเทคนิคเฉพาะซึ่งเป็นทักษะสำคัญที่ Data Scientist พึงมี ได้แก่ 1) ทักษะด้านคณิตศาสตร์ และสถิติ และ 2) ทักษะการเขียนโปรแกรม (programming)

2. ทักษะที่ไม่ใช่เชิงเทคนิคเฉพาะหรือทักษะทั่วไป ที่ช่วยส่งเสริมให้การทำงานเป็นไปอย่าง มีประสิทธิภาพมากขึ้น ได้แก่ คือ 1) ความรู้ด้านธุรกิจ และ 2) ทักษะการสื่อสาร

1. ทักษะด้านคณิตศาสตร์ และสถิติ งานด้าน Data Science มีพื้นฐานมาจากความรู้ด้านคณิตศาสตร์และสถิติเป็นหลัก แม้ปัจจุบันจะมีโปรแกรมที่ช่วยในการวิเคราะห์ทางสถิติ แต่การเลือกใช้แบบจำ ลองในการวิเคราะห์และตีความผลลัพธ์ยังต้องการความรู้เชิงลึกทางคณิตศาสตร์ ดังนั้น ทักษะด้านคณิตศาสตร์ เช่น การเรียนรู้ด้วยเครื่อง(Machine Learning) การทำ เหมืองข้อมูล (Data Mining) พีชคณิต (Algebra) รวมถึงเทคนิคทางวิชาสถิติอื่นๆ ที่ดีจึงเป็นส่วนสำคัญในการทำงานอาชีพนี้

2. ทักษะการเขียนโปรแกรม (programming)การเขียนโปรแกรมและการใช้ซอฟต์แวร์ในการจัดการข้อมูลขนาดใหญ่ รวมถึงการวิเคราะห์และแสดงข้อมูลให้เห็นภาพ (Data Visualization) ถือเป็นทักษะที่จำเป็นอย่างมากของการทำงานด้าน Data Science ซึ่งบ่อยครั้งที่ผู้สมัครงานในตำแหน่ง Data Scientist จะถูกทดสอบโดยให้เขียนโปรแกรมเพื่อแก้โจทย์บางอย่างในการสัมภาษณ์งาน

3. ความรู้ด้านธุรกิจ เพราะความเข้าใจในธุรกิจจะช่วยให้ Data Scientist สามารถตั้งโจทย์เกี่ยวกับธุรกิจได้ดีขึ้น และสามารถวิเคราะห์หาผลลัพธ์ที่ธุรกิจสามารถเอาไปประยุกต์ใช้ให้เกิดประโยชน์และสร้างความแตกต่างได้ดียิ่งกว่าเดิม อย่างไรก็ดี ทักษะด้านนี้หาได้ไม่ง่ายนัก โดยเฉพาะกับ Data Scientist ที่เพิ่งเริ่มทำ งาน จึงอาจต้องใช้เวลาเพื่อทำ ความคุ้นเคยกับคำถามทั่วไปที่ธุรกิจสนใจ รวมถึงคำถามที่เกี่ยวข้องกับธุรกิจเฉพาะด้าน

4. ทักษะการสื่อสาร ทักษะนี้เป็นสิ่งที่หลายคนมักมองข้าม แต่การทำงานของ Data Scientist หลายครั้งจำ เป็นต้องสื่อสารกับเพื่อนร่วมงาน และกับผู้บริหารที่ไม่มีความรู้เชิงเทคนิค ทั้งในช่วงต้นของการทำงาน (เช่น แสดงให้เห็นว่ามีปัญหาที่จุดใด และสิ่งที่กำ ลังจะทำ สามารถสร้างประโยชน์อะไรได้บ้าง) ไปจนถึงการนำ เสนอผลลัพธ์ในรูปแบบที่เข้าใจง่าย เพื่อตัดสินใจนำ ไปใช้ต่อ ซึ่งการสื่อสารที่ดีนั้นต้องการทั้งวิธีนำ เสนอข้อมูลในรูปแบบที่เข้าใจง่าย (Data Visualization) และทักษะการนำเสนอที่ดี

ยิ่ง “Big Data” กลายเป็นสิ่งมีค่าขององค์กรในทุกอุตสาหกรรม นั่นเท่ากับว่าความต้องการบุคลากรในสายอาชีพ “Data Scientist” ยิ่งมีบทบาทสำคัญมากขึ้นเท่านั้น และเทรนด์นี้ไม่ใช่เป็นเพียงกระแสระยะสั้น แต่เป็นแนวโน้มในระยะยาวทั้งในวันนี้ และอนาคต 

Brand Buffet หวังเป็นอย่างยิ่งว่าข้อมูลจาก EIC ชุดนี้จะเป็นประโยชน์อย่างยิ่งต่อวงการการศึกษาในบ้านเรา ที่จะนำไปต่อยอดเพื่อพัฒนาหลักสูตรการศึกษาให้สอดคล้องกับตลาดงาน รวมทั้งองค์กรต่างๆ ไม่ว่าจะภาครัฐ และภาคเอกชน ในการเตรียมความพร้อมด้านบุคลากร

Credit Photo (ภาพเปิด, รูปที่ 5) : NUMBER 24 – Authorized Shutterstock Partner in Thailand

Graphic ประกอบข้อมูล : SCB EIC