บิ๊กดาต้า เทคโนโลยีที่ช่วยการตลาดให้มีประสิทธิภาพ Big Data เป็นเทคโนโลยีที่มีประโยชน์สามารถนำไปประยุกต์ใช้ได้หลากหลายด้านไม่ว่าจะเป็นการวางแผนระดับประเทศ การวางแผนธุรกิจในองค์กร การวางแผนด้านการศึกษา การวางแผนด้านการแพทย์ และในด้านอื่นๆ อีกหลากหลายด้าน ถึงแม้ว่า Big Data จะมีประโยชน์อยู่มาก แต่หากขาดการสนับสนุนที่ดีจากองค์กรก็อาจทำให้ไม่ประสบความสำเร็จได้

นอกจากนี้ยังจำเป็นต้องใช้เงินลงทุนในช่วงแรก และต้องการบุคลากรที่มีความรู้ความสามารถด้าน IT อย่างมาก การเชื่อมต่ออินเตอร์เน็ตที่มีประสิทธิภาพก็มีความสำคัญอย่างมากเช่นเดียวกัน ทั้งในการเชื่อมต่อ หาข้อมูลและรวบรวมข้อมูล ซึ่งในอนาคตเทคโนโลยี Big Data จะมีความสำคัญในการใช้ชีวิตประจำวันอย่างมาก เนื่องจากข้อมูลที่มีอยู่ทั้งหมดจะสามารถนำไปวิเคราะห์และประมวลผลได้ทั้งหมด

ขั้นตอนและกระบวนการทำงานของ Big Data มีอยู่ 3 ขั้นตอนหลักๆ ดังนี้

1. จัดเก็บข้อมูล (Storage)
เป็นขั้นตอนการจัดเก็บรวบรวมข้อมูลทั้งหมดจากแหล่งต่างๆ ไม่ว่าจะเป็นข้อมูลที่มีคุณภาพรวมถึงข้อมูลที่คาดว่าอาจจะเป็นประโยชน์ ไม่ว่าจะเป็นข้อมูลที่เป็นตัวอักษร ไฟล์เอกสาร ไฟล์รูปภาพ ไฟล์วีดีโอ ไฟล์เสียงที่ถูกบันทึก จะถูกเก็บรวบรวมไว้ที่นี่

2. การประมวลผลข้อมูล (Processing)
การประมวลผลข้อมูล หลังจากที่นำข้อมูลมารวบรวมไว้ได้ในที่เดียวแล้ว ข้อมูลต่างๆ จะถูกนำไปจัดหมวดหมู่ให้อยู่ในกลุ่มที่มีความเกี่ยวข้องกันหรือความสัมพันธ์ใกล้เคียงกัน ให้ผลลัพธ์คล้ายคลึงกันมากที่สุด แล้วจึงนำมาเปลี่ยนเป็นรูปแบบข้อมูลเพื่อนำเอาข้อมูลที่มีอยู่เหล่านี้เข้าระบบข้อมูลที่ผ่านการประมวลผลแล้ว

3. การวิเคราะห์ข้อมูล (Analyst)
การวิเคราะห์ข้อมูลและนำเสนอข้อมูล หลังจากที่ข้อมูลทั้งหมดได้ถูกจัดกลุ่มและแยกประเภทเรียบร้อยแล้วนั้น ต่อจากนั้นจะนำมาวิเคราะห์หา Pattern ความเกี่ยวข้องกันทั้งหมด ที่อาจมองไม่เห็นได้เลยด้วยตา ไม่ว่าจะเป็นการหา แนวโน้มของการตลาด ความต้องการของลูกค้า กระแสที่อาจเกิดขึ้นได้ในอนาคต และข้อมูลด้านอื่นที่เป็นประโยชน์ และจัดมานำเสนอในรูปแบบต่างๆ ไม่ว่าจะเป็นรูปภาพหรือกราฟ

คุณลักษณะสำคัญของ Big Data
คุณสมบัติของ Big Data นั้น จะมีลักษณะโดยรวมอยู่ 6 ประการด้วยกัน หรือที่มีการพูดถึงในชื่อ “5Vs 1C” โดยคุณลักษณะทั้ง 6 ของ Big Data นั้น มีดังนี้

1. ข้อมูลที่มีปริมาณมาก (Volume)

หมายถึง มีปริมาณข้อมูลอยู่มาก มีขนาดใหญ่ สามารถนับรวมได้ทั้งข้อมูลแบบออนไลน์และแบบออฟไลน์ โดยข้อมูลต้องมีขนาดใหญ่เกินกว่า Terabyte

ยกตัวอย่างเช่น การเข้าถึงอินเทอร์เน็ตของประชากรทั่วโลกที่มีจำนวนเพิ่มมากขึ้นทุกปี ซึ่งแต่ละคนมีพฤติกรรมการใช้งานข้อมูลที่หลากหลาย ทำให้ปริมาณของข้อมูลที่เกิดขึ้นมีจำนวนมหาศาล

2. ข้อมูลที่มีความหลากหลาย (Variety)

หมายถึง ข้อมูลแต่ละชนิดนั้นมีความหลากหลาย รวมกันทั้งรูปแบบมีโครงสร้าง ไม่มีโครงสร้าง และกึ่งโครงสร้าง

ยกตัวอย่างผ่านพฤติกรรมของ Social Media User ที่ในแต่ละวันสามารถสร้างชุดข้อมูลได้หลากหลาย เช่น การคอมเมนต์ลงในโพสต์ทาง Facebook จัดเป็นข้อมูลแบบไม่มีโครงสร้าง เพราะไม่สามารถคาดเดาคำตอบและโพสต์ที่เขาสนใจจากคอมเมนต์ได้

หรือการโพสต์ลงบน Twitter ที่สามารถจัด Category ของแต่ละโพสต์ผ่าน Hashtag ได้ แต่ก็ไม่สามารถระบุโครงสร้างหรือความหมายของ Hashtag นั้นได้อย่างชัดเจน นี่จึงจัดเป็นข้อมูลกึ่งโครงสร้าง

ส่วนข้อมูลที่ได้จากการตอบแบบสอบถามผ่าน Google Form ที่มีคำถามและคำตอบให้เลือกอย่างชัดเจน และข้อมูลนั้นสามารถนำไปใช้ต่อได้เลยทันที จะจัดว่าเป็นชุดข้อมูลแบบมีโครงสร้าง

เนื่องจากการใช้งานของ Social Media User นั้นไม่ได้เป็นระเบียบแบบแผนตายตัว ทำให้นอกจากมีปริมาณข้อมูลเกิดขึ้นอย่างมหาศาลแล้ว ข้อมูลเหล่านั้นยังเต็มไปด้วยความหลากหลายและซับซ้อนอีกด้วย

3. ข้อมูลที่มีการเพิ่มขึ้นอย่างรวดเร็ว (Velocity)

หมายถึง ข้อมูลที่มีการเพิ่มขึ้นและเกิดความเปลี่ยนแปลงอย่างรวดเร็ว ทำให้เกิดข้อมูลแบบ Real-time มากมาย อย่างเช่นข้อมูลการจราจร ซึ่ง Google Map ก็ได้ใช้ประโยชน์จากการเข้าถึง GPS ของผู้ที่สัญจรไปมาบนท้องถนน เพื่อวิเคราะห์และนำเสนอเส้นทางที่การจราจรคล่องตัวที่สุดให้กับผู้ใช้งาน

4. ข้อมูลที่สร้างประโยชน์นำไปใช้ในทางธุรกิจได้ (Value)

หมายถึง ข้อมูลที่มีคุณค่าต่อการนำไปใช้งาน สามารถก่อให้เกิดประโยชน์ทางธุรกิจได้เป็นอย่างดี ยกตัวอย่างเช่น พฤติกรรมการค้นหาข้อมูลผ่าน Google ที่ทำให้สามารถทราบถึงความสนใจของผู้คนในช่วงเวลานั้นๆ ได้

5. ข้อมูลต้องมีความถูกต้องชัดเจน (Veracity)

เนื่องจาก Big Data นั้นรวบรวมข้อมูลไว้เป็นจำนวนมหาศาล เพราะฉะนั้น สิ่งที่สำคัญที่สุดก็คือความถูกต้องชัดเจนของข้อมูล ซึ่งจะเป็นส่วนสำคัญที่จะสามารถนำข้อมูลเหล่านั้นมาประมวลผลเพื่อการใช้งานต่อในอนาคตได้

6. ข้อมูลต้องมีความเชื่อมโยงกัน (Complexity)

การจะใช้ประโยชน์จาก Big Data ได้นั้น มีอีกหนึ่งปัจจัยสำคัญนั่นก็คือความเชื่อมโยงกันของข้อมูล หากสิ่งที่รวบรวมมานั้นไม่สามารถหาจุดเชื่อมโยงกันได้ ข้อมูลเหล่านั้นก็ไร้ประโยชน์ การเก็บ Data ที่มีประสิทธิภาพนั้นจึงต้องคำนึงถึงความสัมพันธ์กันของข้อมูลด้วย