การเร่งประสิทธิภาพเครือข่าย: ผลกระทบของ RDMA ต่ออีเทอร์เน็ตแบบรวม (RoCE)

By Tawfeeq Ahmad

วิวัฒนาการที่รวดเร็วของแอปพลิเคชันที่ต้องใช้การประมวลผลอย่างหนักทำให้มีความต้องการโซลูชันเครือข่ายที่รวดเร็ว มีประสิทธิภาพมากขึ้น และปรับขนาดได้ หนึ่งในเทคโนโลยีเชิงนวัตกรรมใหม่ล่าสุดที่เกิดขึ้นเพื่อตอบสนองความต้องการนี้คือ Remote Direct Memory Access (RDMA) ผ่าน Converged Ethernet (RoCE) เทคโนโลยีอันล้ำสมัยนี้อำนวยความสะดวกในการถ่ายโอนข้อมูลโดยตรงระหว่างระบบโดยไม่ต้องใช้การแทรกแซงของ CPU ช่วยลดเวลาแฝงได้มากและปรับปรุงประสิทธิภาพโดยรวมของระบบ iWave ซึ่งเป็นบริษัทออกแบบ FPGA ที่มีชื่อเสียง อยู่แนวหน้าของความก้าวหน้าครั้งนี้ โดยได้นำโซลูชัน 100G Ethernet ที่แข็งแกร่งมาใช้งาน โดยผสานรวม ERNIC IP (Ethernet RDMA Network Interface Controller Intellectual Property) ของ AMD เข้าในพอร์ตโฟลิโอโมดูลคอมพิวเตอร์ฝังตัวของตน การบูรณาการนี้ถูกกำหนดขึ้นเพื่อปรับปรุงความสามารถของ RDMA ในแอปพลิเคชันประสิทธิภาพสูง

ภาพของ RoCE ช่วยให้ถ่ายโอนข้อมูลระหว่างระบบได้โดยตรงรูปที่ 1: RoCE ช่วยให้ถ่ายโอนข้อมูลระหว่างระบบโดยตรงได้โดยไม่ต้องให้ CPU เข้ามาแทรกแซง ช่วยลดเวลาแฝงได้อย่างมากและปรับปรุงประสิทธิภาพโดยรวมของระบบ (ที่มาของภาพ: iWave)

ทำความเข้าใจ RDMA ผ่านการคอนเวอร์จอีเทอร์เน็ต (RoCE)

RDMA เป็นเทคโนโลยีสำคัญที่ช่วยให้สามารถถ่ายโอนหน่วยความจำระหว่างโฮสต์หรือเซิร์ฟเวอร์โดยตรง โดยหลีกเลี่ยง CPU ได้อย่างมีประสิทธิภาพ ความสามารถนี้ช่วยให้ CPU สามารถเน้นที่การทำงานของแอปพลิเคชันและการประมวลผลข้อมูล ส่งผลให้ประสิทธิภาพของเครือข่ายดีขึ้นอย่างเห็นได้ชัด โดยมีความหน่วงน้อยลง โหลดของ CPU น้อยลง และแบนด์วิดท์เพิ่มขึ้น ทั้งหมดนี้ทำได้อย่างคุ้มต้นทุน RoCE เป็นโปรโตคอลเครือข่ายเฉพาะที่ออกแบบมาเพื่อรองรับการดำเนินการ RDMA บนเครือข่ายอีเทอร์เน็ต การใช้ประโยชน์จากโครงสร้างพื้นฐาน Ethernet ที่มีอยู่ทำให้ RoCE เป็นตัวเลือกที่น่าสนใจสำหรับองค์กรที่ต้องการเพิ่มประสิทธิภาพโดยไม่ต้องยกเครื่องการตั้งค่าเครือข่ายปัจจุบันของตน

ประเภทของ RoCE

RoCE แบ่งออกเป็นสองเวอร์ชันที่แตกต่างกันตามอะแดปเตอร์เครือข่ายที่ใช้: RoCE v1 และ RoCE v2

  1. RoCE v1: โปรโตคอลนี้อนุญาตการสื่อสารระหว่างโฮสต์สองเครื่องที่อยู่ภายในโดเมนการบรอดคาสต์อีเทอร์เน็ต (VLAN) เดียวกัน ใช้ Ethertype 0x8915 และจำกัดเฟรม Ethernet มาตรฐานไว้ที่ 1,500 bytes ในขณะที่อนุญาตให้เฟรมจัมโบ้ Ethernet ขยายได้ถึง 9,000 bytes
  2. RoCE v2: การแก้ไขข้อจำกัดของ RoCE v1, RoCE v2 ได้แนะนำการปรับปรุงในด้านการหุ้มแพ็คเก็ตด้วยการรวมส่วนหัว IP และ UDP การปรับเปลี่ยนนี้ทำให้ RoCE v2 ทำงานได้อย่างราบรื่นบนเครือข่ายทั้งเลเยอร์ 2 (เลเยอร์ลิงก์ข้อมูล) และเลเยอร์ 3 (เลเยอร์เครือข่าย) จึงรองรับการกำหนดเส้นทางเลเยอร์ 3 และการปรับขนาดได้ในหลายซับเน็ต (subnets) RoCE v2 ซึ่งมักเรียกกันว่า Routable RoCE (RRoCE) ยังเพิ่มการรองรับสำหรับการมัลติคาสต์ผ่าน IP ทำให้การใช้งานมีขอบเขตกว้างยิ่งขึ้น

ERNIC IP: เสริมศักยภาพ RDMA

IP ERNIC (Embedded RDMA enabled NIC) เป็นแกน IP ของตัวควบคุมอินเทอร์เฟซเครือข่าย Ethernet RDMA ที่ปรับแต่งได้ ซึ่งออกแบบมาเพื่อการบูรณาการที่ราบรื่นกับ AMD FPGA, MPSoC และการใช้งาน MAC IP แบบซอฟต์แวร์ โซลูชันนี้โดดเด่นด้วยอัตราข้อมูลสูง ความหน่วงต่ำ และกลไกการถ่ายโอนข้อมูลที่เชื่อถือได้และถ่ายโอนข้อมูลผ่านฮาร์ดแวร์ทั้งหมดผ่านอีเทอร์เน็ตมาตรฐาน iWave ได้แสดงให้เห็นถึงความมุ่งมั่นในการพัฒนาเทคโนโลยีด้วยการนำโซลูชัน 100G Ethernet มาใช้อย่างประสบความสำเร็จ ความสำเร็จนี้เป็นไปได้ด้วยการใช้ ชุดพัฒนาที่ขับเคลื่อนด้วย MPSoC Zynq UltraScale+ ของ iWave ซึ่งบูรณาการ ERNIC IP ของ AMD

ชุดพัฒนา MPSoC Zynq UltraScale+ ได้รับการออกแบบมาโดยเฉพาะสำหรับการสร้างต้นแบบและการประเมินโซลูชัน 100G Ethernet โดยใช้ตัวเชื่อมต่อ QSFP-28 ความเร็วสูง

การตั้งค่าสาธิต

การตั้งค่าสาธิตทั่วไป (รูปที่ 2) ประกอบด้วย:

ไดอะแกรมของชุดพัฒนา iWave Zynq UltraScale+ MPSoCรูปที่ 2: การตั้งค่าทั่วไปสำหรับชุดพัฒนา Zynq UltraScale+ MPSoC (แหล่งที่มาของภาพ: iWave)

ภาพรวมสถาปัตยกรรมระบบ

สถาปัตยกรรมระบบได้รับการออกแบบมาเพื่อเพิ่มประสิทธิภาพการถ่ายโอนข้อมูล โดยมีบทบาทที่กำหนดไว้อย่างชัดเจนระหว่างส่วนประกอบของระบบประมวลผล (PS) และลอจิกที่ตั้งโปรแกรมได้ (PL) การใช้งานยังมีการซิงโครไนซ์โปรโตคอลเวลาแม่นยำ (PTP) ซึ่งมีความสำคัญอย่างยิ่งสำหรับแอปพลิเคชันแบบเรียลไทม์ ด้วยมาตรวัดประสิทธิภาพที่โดดเด่น เช่น ความสามารถในการจัดการวิดีโอ 8K ที่อัตรามากกว่า 100 เฟรมต่อวินาที แอปพลิเคชันที่มีศักยภาพจึงขยายไปในหลายภาคส่วน เช่น ศูนย์ข้อมูล มัลติมีเดีย และการประมวลผลประสิทธิภาพสูง เน้นย้ำถึงความหลากหลายและความสำคัญของเทคโนโลยีในสภาพแวดล้อมการประมวลผลสมัยใหม่

สถาปัตยกรรมระดับสูงของระบบซึ่งแสดงในรูปที่ 3 เน้นย้ำถึงบทบาทที่แตกต่างกันของส่วนประกอบ PS และ PL ภายใน Zynq UltraScale+ MPSoC PS มี Hard SoC ที่ใช้ ARM Cortex-A53 ซึ่งจำเป็นสำหรับการกำหนดค่าระบบ การควบคุม และการวินิจฉัย ส่วนประกอบหลักของสถาปัตยกรรมนี้ได้แก่:

  • 100G Ethernet MAC Driver: รับประกันประสิทธิภาพที่แข็งแกร่งและการส่งข้อมูลที่มีความหน่วงต่ำที่ 100Gb/s
  • ERNIC Controller Driver: รับผิดชอบในการจัดการข้อมูลขาเข้าไปยัง DDR และอำนวยความสะดวกในการสื่อสารระหว่างแอปพลิเคชันผู้ใช้และ ERNIC IP ผ่านการแลกเปลี่ยนกริ่งประตูที่มีประสิทธิภาพ
  • RDMA Core and User Space Libraries: รับประกันความเข้ากันได้และประสิทธิภาพที่เหมาะสมที่สุดสำหรับการดำเนินการ RDMA ทั้งบนเคอร์เนลและพื้นที่ผู้ใช้

ไดอะแกรมของระบบประมวลผลและส่วนประกอบลอจิกที่ตั้งโปรแกรมได้ภายใน iWave Zynq UltraScale+ MPSoCรูปที่ 3: จุดเด่นของบทบาทที่โดดเด่นของระบบประมวลผลและส่วนประกอบลอจิกที่ตั้งโปรแกรมได้ภายใน Zynq UltraScale+ MPSoC (ที่มาของภาพ: iWave)

AMD ERNIC IP มีประสิทธิภาพในการถ่ายโอนสแต็ก RoCE v2 ไปยัง FPGA โดยที่ ERNIC Controller ทำหน้าที่จัดการการแฮนด์เชคระหว่างโมดูลต่างๆ เพื่ออำนวยความสะดวกในการถ่ายโอนข้อมูล สร้างรายการคิวงานและส่งการแจ้งเตือน (กริ่งประตู) ไปยัง ERNIC IP ในขณะเดียวกัน ระบบย่อย 100G อีเทอร์เน็ต ของ Zynq UltraScale+ MPSoC จะจัดการ MAC และเลเยอร์กายภาพ ในขณะที่เครื่องสร้างรูปแบบข้อมูลจะรับผิดชอบในการสร้างข้อมูลดิบและรูปแบบข้อมูลวิดีโอ

โปรโตคอลเวลาความแม่นยำ (PTP)

ค่าประทับเวลา PTP (มาตรฐาน IEEE 1588) มีบทบาทสำคัญในการซิงโครไนซ์เวลาในระบบต่างๆ บนเครือข่ายอีเทอร์เน็ต การซิงโครไนซ์นี้มีความสำคัญอย่างยิ่งต่อการเพิ่มประสิทธิภาพของแอปพลิเคชันแบบเรียลไทม์ ช่วยให้สามารถแลกเปลี่ยนข้อมูลแบบซิงโครไนซ์และมีความหน่วงต่ำที่ระดับนาโนวินาทีได้

ไฮไลท์สำคัญของการตั้งค่า

คุณสมบัติที่โดดเด่นของการตั้งค่านี้ได้แก่:

  • การนำ 100G อีเทอร์เน็ต ไปใช้บน RoCE v2 โดยใช้ AMD ERNIC IP
  • ประเภทการขนส่งการเชื่อมต่อที่เชื่อถือได้
  • ฟังก์ชัน RDMA SEND, RDMA READ และ RDMA WRITE สำหรับการจัดการแพ็คเก็ต
  • รองรับประเภทข้อความ RDMA Send with Immediate และ RDMA Write with Immediate
  • การทดสอบประสิทธิภาพสำหรับ RDMA โดยใช้แอปพลิเคชัน XRPING และ PERFTEST
  • เครื่องกำเนิดรูปแบบข้อมูลที่กำหนดเองสำหรับรูปแบบข้อมูล RAW และวิดีโอ
  • การแทรกค่าประทับเวลา PTP ควบคู่ไปกับข้อมูล

สถิติปริมาณงานโดยละเอียดสำหรับการถ่ายโอนข้อมูลวิดีโอจากชุดพัฒนา Zynq UltraScale+ MPSoC ไปยังเซิร์ฟเวอร์พีซีเผยให้เห็นประสิทธิภาพที่น่าประทับใจด้วยความสามารถในการจัดการวิดีโอ 8K ที่มากกว่า 100fps และวิดีโอ 4K ที่มากกว่า 400fps

การประยุกต์ใช้งานที่มีศักยภาพ

การบูรณาการของ RDMA บน Converged Ethernet และ ERNIC IP จะเปิดช่องทางใหม่ๆ ให้กับอุตสาหกรรมต่างๆ ช่วยเพิ่มการเชื่อมต่อ ประสิทธิภาพการทำงาน และประสิทธิผลในแอปพลิเคชันต่างๆ อย่างมีนัยสำคัญ รวมถึง:

  • Datacenters and cloud computing: อำนวยความสะดวกในการสื่อสารระหว่างเซิร์ฟเวอร์อย่างมีประสิทธิภาพและเร่งการประมวลผลข้อมูลในสถาปัตยกรรมระบบคลาวด์
  • Video/image capture and transfer: เป็นประโยชน์สำหรับแอปพลิเคชันมัลติมีเดีย การออกอากาศ และสภาพแวดล้อมเสมือนจริง (VR)
  • Storage solutions: ช่วยให้ถ่ายโอนข้อมูลระหว่างอุปกรณ์จัดเก็บข้อมูลและเซิร์ฟเวอร์ได้รวดเร็วยิ่งขึ้น จึงช่วยปรับปรุงประสิทธิภาพของระบบจัดเก็บข้อมูล
  • High-performance computing (HPC): เพิ่มความเร็วในการถ่ายโอนข้อมูลและลดเวลาแฝงภายในคลัสเตอร์ HPC สำหรับงานคำนวณและการจำลองที่รวดเร็วยิ่งขึ้น
  • IoT Edge devices: ช่วยให้สามารถรวบรวมและส่งข้อมูลแบบเรียลไทม์จากเซ็นเซอร์และอุปกรณ์ต่าง ๆ ได้

เนื่องจากความต้องการโซลูชันการถ่ายโอนข้อมูลที่เร็วขึ้นและมีประสิทธิภาพมากขึ้นยังคงเพิ่มขึ้น RDMA บน Converged Ethernet และ ERNIC IP จึงพร้อมที่จะมีบทบาทสำคัญในอนาคตของการประมวลผลประสิทธิภาพสูง

บทสรุป

กลุ่มผลิตภัณฑ์แพลตฟอร์ม FPGA และ SoC FPGA ที่หลากหลายของ iWave รวมกับความเชี่ยวชาญทางเทคนิคอันล้ำลึก ช่วยให้ลูกค้าสามารถพัฒนาผลิตภัณฑ์ล้ำสมัยที่ใช้ประโยชน์จากความก้าวหน้าล่าสุดในด้านปัญญาประดิษฐ์ (AI) การเรียนรู้ของเครื่องจักร และการประมวลผลแบบ edge ด้วยการเป็นพันธมิตรกับ iWave บริษัทต่างๆ จะสามารถเร่งการพัฒนาผลิตภัณฑ์ ลดความเสี่ยง และก้าวล้ำหน้าคู่แข่งขันในภูมิทัศน์ด้านเทคโนโลยีที่ซับซ้อนมากขึ้นเรื่อยๆ

หากต้องการข้อมูลเพิ่มเติมหรือหารือเกี่ยวกับข้อกำหนดที่กำหนดเอง โปรดติดต่อเราที่ mktg@iwave-global.com

Disclaimer: The opinions, beliefs, and viewpoints expressed by the various authors and/or forum participants on this website do not necessarily reflect the opinions, beliefs, and viewpoints of DigiKey or official policies of DigiKey.

About this author

Image of Tawfeeq Ahmad

Tawfeeq Ahmad

A strong interest in product marketing coupled with a passion for IoT and Wireless Solutions, Tawfeeq specializes in building connected mobility solutions and Industrial IoT Solutions. With data being the new money, there is a dependency for rugged gateways and innovative hardware. Tawfeeq likes to help companies in their transformation journeys.