Hướng dẫn tính năng AutoScaling K8S trên Cloud Gen 4

2 phút đọc

Mục lục

Hướng dẫn các loại AutoScaling trên K8S
Cách thực hiện Scale Node thủ công
Cách thực hiện AutoScaling K8S
Tổng kết

Bài viết sẽ giới thiệu và demo về tính năng AutoScaling các node trong K8S trên Cloud Gen 4.

Hướng dẫn các loại AutoScaling trên K8S #

K8S hỗ trợ 3 loại AutoScaling sau:

Vertical Pod Autoscaler (VPA): Điều chỉnh CPU và RAM cho các pod độc lập để tối ưu lượng tài nguyên được sử dụng. VPA giúp đảm bảo ứng dụng của Quý Khách luôn có đủ lượng tài nguyên cần thiết để hoạt động một cách hiệu quả.
Horizontal Pod Autoscaler (HPA): Tăng hoặc giảm số lượng các bản sao của pod dựa trên các thông số như CPU Usage hoặc các thông số tùy chọn khác. HPA giúp duy trì hiệu suất ứng dụng ngay cả khi nhu cầu đột ngột tăng.
Cluster Autoscaler (CA): Điều chỉnh tăng số lượng node trong cụm K8S giúp giảm tải và đảm bảo workload hoạt động bình thường trong trường hợp những node ban đầu đã không còn đủ tài nguyên. Và giảm đi khi không cần thiết.

Bài viết này sẽ demo về cách hoạt động của HPA và CA.

Cách thực hiện Scale Node thủ công #

Sau khi tạo cụm K8S trên Cloud Gen 4, Quý Khách có thể chọn Scale Up hoặc Down các node thủ công bằng cách chọn Compute > Kubernetes > chọn cụm K8S Quý Khách muốn Scale và chọn Scale Kubenernetes Cluster.

Sau đó nhập giá trị Worker Nodes mà Quý Khách muốn tăng lên hoặc giảm xuống.

Lưu ý: Quý Khách có thể chọn cấu hình tài nguyên khác nhau (Compute Offering) giữa Worker Nodes và Control Nodes để đáp ứng nhu cầu và phù hợp với tài nguyên tài khoản.

Cách thực hiện AutoScaling K8S #

Để thực hiện AutoScaling, Quý Khách chọn Enable auto scaling on this cluster và nhập giá trị min và max số lượng node trong cụm.

vHost đã tải kubectl và file config của cụm K8S trên để thuận tiện cho việc kiểm tra và thao tác.

HPA sẽ cần metrics-server để lấy thông tin metric từ pod và node để quyến định và tiến hành Scale.

Quý Khách có thể kiểm tra metric đã chạy hay chưa.

Tiếp theo vHost sẽ tiến hành chạy pod.

Tiếp theo vHost sẽ set CPU utilization target mà HPA dùng để scale Pod.

Cụ thể: khi trung bình CPU usage của Pod vượt quá 50% so với request CPU đã khai báo trong Pod, HPA sẽ scale thêm replica. Ngược lại, nếu CPU usage < 50% trong một thời gian, HPA có thể scale giảm replica

vHost sẽ tạo và chạy file loadtest.yaml để tạo lưu lượng HTTP request liên tục đến php-apache.

Khi này lượng tài nguyên yêu cầu sẽ tăng cao, HPA sẽ liên tục scaling pod để đảm bảo nhu cầu. Khi các node ban đầu không còn đủ tài nguyên để chạy các pod mới, CA sẽ tăng số lượng node.

Số lượng Worker node đã tăng từ 2 lên 5.

Khi giảm lưu lượng truy cập HTTP, đồng nghĩa với việc nhu cầu tài nguyên không còn nhiều, HPA và CA sẽ tiền hành giảm số lượng pod và node cho phù hợp.

Tổng kết #

Như vậy là vHost đã giới thiệu và demo tính năng AutoScaling trong cụm K8S trên Cloud Gen 4. Hy vọng hướng dẫn này sẽ giúp Quý Khách có thể sử dụng dịch vụ với trải nghiệm tốt hơn.

Nếu Quý khách hàng có thắc mắc gì trong quá trình thực hiện, Quý khách có thể liên hệ qua các kênh sau:

Tổng đài hỗ trợ khách hàng: 19006806 – phím 2
Email: support@vHost.vn
Ticket: https://members.vhost.vn/tickets/new/

Nếu Quý Khách có bất kỳ câu hỏi hoặc phản hồi nào, hãy để lại bình luận bên dưới.

What are your Feelings

Updated on October 3, 2025

Compute

Kubernetes

Private Cloud

Block Storage

Object Storage

Cloud File

VPS Giá Rẻ

NVMe VPS

GPU VPS

Managed VPS

Database

VPS n8n

Bare Metal Server

Thuê chỗ đặt máy chủ

Dịch vụ GPU Server

Anycast IP

CDN

Load Balancers

Cloud WAF

Scrubbing Center

AntiDDoS

Business Hosting

WordPress Hosting

Hosting Giá Rẻ

Windows Hosting

SEO Hosting

Reseller Hosting

SEO Hosting Giá Rẻ

Reseller Hosting Giá Rẻ

Email Hosting

Email Pro

Email Relay

Email Server

Hybrid Email

Email Archiving

Email Security

Email Marketing