Giới thiệu

AWS Certification là chứng chỉ được câp bởi Amazon đánh giá mức độ hiểu biết về aws cloud, cụ thể là các dịch vụ của Amazon Web Services (AWS) cũng như việc áp dụng các dịch vụ đó 1 cách hiệu quả vào trong các bài toán thực tế. Bộ chứng chỉ này được chia thành các phần: Cloud Practitioner, Architect, Developer và Operations, ngoài ra có thêm Specialty.
Về độ khó thì có 3 mức:

  • Foundational
  • Asociate
  • Professional

Chi tiết về các chứng chỉ các bạn tham khảo ở hình dưới đây:
uc?id=1VvxRrjCSyxyPgOrUToUOzO4P9Qhf5i51&export=download
Tham khảo: https://aws.amazon.com/certification/

Kế hoạch học thi

Đầu tiên mình chọn mục tiêu là chứng chỉ: AWS Certified Solutions Architect – Associate. Chứng chỉ này có độ khó trung bình theo mình biết thì ngang tầm 1 năm kinh nghiệm sử dụng AWS, sở dĩ mình chọn chứng chỉ này vì các lý do sau:

  1. Bản thân cũng có 2 năm kinnh nghiệm về Architect nhưng là một cloud khác, ngoài phần infrastrcuture ra thì team mình control toàn bộ, và không có nhiều service support như AWS.
  2. Chứng chỉ với độ khó trung bình trước mắt phù hợp với năng lực bản thân.

Mình chọn khoá học ở https://linuxacademy.com/ và vì chưa từng có kinnh nghiêmh sử dụng AWS nên mình sẽ phải học qua khoá AWS Cloud Practitioner, khoá này mất khoảng 17 giờ học online và thời gian thực tế mình hoàn thành khoá học này mấy khoảng 10 ngày học. Tiếp theo mình sẽ học AWS Certified Solutions Architect – Associate - khoá học này có thời lượng 57 giờ học online, mình lên plan dự kiến hoàn thành trong một tháng.
Mình đã hoàn thành khóa học AWS Cloud Practitioner và AWS Certified Solutions Architect – Associate trong khoảng 2 tháng, mỗi ngày 1-2h và 2-3h vào cuối tuần.

Đi thi

Sau 2 tháng học và khoảng 1 tuần để ôn tập kiến thức thì mình đi thi, mình đã book lịch thi từ thời điểm bắt đầu khóa Solutions Architect – Associate. Vì vậy ở thời điểm thi mình còn nhiều kiến thức chưa chuyên sâu, mập mờ giữa các service.
Kết quả: 674/1000 => FAIL
Đề thi có 65, 720/1000 trở lên là điểm pass. Hơi tiết một chút nhưng dù sao nó cũng năm trong dự đoán của mình (từ 650-700). Vì mình có làm một số đề thi thử nhưng cũng chỉ đạt khoảng 50-70%, trong khi đề thi thật thì dài và khó hơn 1 chút.

Các chủ đề ôn tập

Sau khi sumit bài thi thì bạn biết luôn kết quả là PASS hay FAIL, nhưng để biết điểm thì bạn phải vào trang aws training - nơi mà bạn đăng ký online.
OK fail rồi, thế thì để rút kinh nghiệm cho lần thi sau mình đã nhớ lại các câu hỏi làm mình mập mờ giữa 2 đáp án, hay những câu mà mình thấy có nhiều phương án đúng nhưng lựa chọn thằng nào là tốt nhất cho trường hợp tiết kiệm chi phí hay là high availbility nhất v.v.., sau đó mình lục lại tài liệu ở khóa học trên trang https://linuxacademy.com/ bản pdf để lướt qua lại một lần và note lại những điểm cần phải tìm hiểu kỹ hơn cũng như so sánh những service giống nhau.
Và dưới đây là các chủ đề mà mình note nhanh lại và sẽ lên kế hoạch để cường hóa kiến thức cho lần thi sắp tới. Mình đã book lịch thi vào đầu tháng 8/2020 nhưng do dịch covid-19 bùng phát tại Đà Nẵng nên mình đã dời sang đầu tháng 10/2020.

  • DataSync
  • VPN và Direct Connect
  • on-premise to Cloud
  • Snowball, Snowball Edge và Snowmobile (chú ý đến dung lượng)
  • Dung lượng data chuyển lên Cloud
  • NAT gatewate và NAT Instance
  • S3
  • SNS, SQS, (FIFO, Standard)
  • So sánh Amazon MQ, SQS, SNS
  • Data từ on-premeise to Cloud thông qua EFS, File Storage gatewate, Volume storage gatewate.
  • Storage Gateway
  • EBS Throughput Optimized HDD , provisined, popular purpose
  • Tìm hiểu về CloudFoudation và Elast ic Beanstalk
  • CloudFront hạn chế user theo khu vực địa lý : Geo.. và Geoxy...
  • Athena và Redshift
  • Tìm hiểu kỹ về DynamoDB, Aurora
  • Secure
  • Khi nào dùng NAT, VPC endpoint, VPC privatelink. Best Pract ice and HA
  • Kiness và Lampda trigger
  • DB nào cho phép AZ, hay replicate another region
  • EFS: performance method: General purpose and Max I/O, thoughput model: Bursting Throughput and Provisioned
  • I/O liên quan đến RAM hay CPU
  • Cloudfront và OAI
  • Encryption: S3, DB, bucket
  • S3: versioning and presigned URL, MFA Delete and Encrypt, Cross-Origin Resource Sharing (CORS)
  • Rout 53: Rout e 53 and Healt h Checks, các loại record
  • ELB
  • VPC: NAT gatewate and NAT Insrance, Egress-only int ernet gat eways, VPC Endpoint
  • Net work Access Cont rol List s (NACLs):
  • Sercurity group
  • Bast ion Hosts
  • ECS: EC2 mode và Fargate Mode
  • Lamda
  • các loại Instance trong Ec2
  • Role and policy
  • DynamoDB Accelerator (DAX)
  • auto scaling group is configured with default termination policy
  • EBS cross region or create snapshot
  • So sanh Dynamo Redshift Aurora
  • using standard SQL and existing business intelligence tools
  • Amazon GuardDuty
  • CloudWatch Event
  • VNP Cloudhub

Mình sẽ không viết kỹ về các service vì cái này có nhiều blog khác đã viết (tiếng Việt và tiếng Anh). Mình sẽ nêu ra những điểm cần lưu ý khi nói về các service đó, và đưa link tham khảo để các bạn tìm hiểu kỹ hơn.

S3

Khá nhiều câu hỏi liên quan đến service này, một service kinh điển của AWS.
uc?id=1pzGUYvWrUd6hdecaWLRRRxgsN216KpcJ&export=download
Nguồn: https://www.msp360.com/resources/blog/amazon-s3-storage-classes-guide/

Lưu ý

S3 Standard: Chi phí lưu trữ cao nhất, tốc độ truy cập nhanh
S3 Standard Infrequent Access: Giống như cái tên của nó, khi chúng ta cần lưu trữ dữ liệu nhưng không truy cập thường xuyên, tuy nhiên khi cần truy cập phải được phản hồi ngay lập tức.
S3 Intelligent Tiering: có thể nói đây không phải là một storage class, vậy khi nào thì bạn chọn loại này - khi chúng ta không dự đoán được tấn suất truy cập cho những dữ liệu này. AWS sẽ monitor và sẽ chuyển qua chuyển lại giữa các class tùy theo tần suất truy cập đến dữ liệu để đảm bảo tiết kiệm chi phí cho bạn.
Amazon Glacier: Đây là class dành cho dữ liệu truy cập không thường xuyên và chi phí rẻ, và tùy thuộc vào thời gian bạn muốn lấy giữ liệu mà nó chia làm các retrieval options như sau (cái này hay hỏi bài thi):

  • expedite retrieval - 1-5 minutes
  • standard - 3-5 hours
  • bulk - 5-12 hours

Amazon Glacier Deep Archive: Đây là class có chi phí lưu trữ rẻ nhất, cùng với đó là thời gian để truy xuất dữ liệu cũng chậm 12 - 48 hours.

Câu hỏi mẫu

uc?id=14KdTftgXqiPhCLq05aVPPAkqk6pmGPic&export=download
uc?id=1Y-rVkgr8fNVaDfT3pIf7ffufOGU5qq2x&export=download
uc?id=1Yf3WtYA_6rwXck6MJaea6tBB0-f15fKx&export=download

Tài liệu tham khảo

https://aws.amazon.com/s3/?nc1=h_ls
https://aws.amazon.com/s3/storage-classes/?nc=sn&loc=3
https://www.msp360.com/resources/blog/amazon-s3-storage-classes-guide/

EC2

Một số lưu ý để ước tính chi phí Amazon EC2 là: Operating systems, Clock hours of server time, Pricing Model, Instance type and Number of instances

Pricing models for Amazon EC2:

  • On-Demand Instances
  • Reserved Instances
  • Spot Instances
  • Dedicated Hosts

On-Demand Instances

Không cần trả trước, bạn có thể tăng giảm khả năng compute để đáp ứng như cầu của bạn và bạn sẽ chi trả cho những gì bạn dùng. Phù hợp với các công việc thử nghiệm trong thời gian ngắn và không đoán trước được. Vd cho trường hợp sử dụng On-Demand Instances là khi bạn scale OUT instances để phục vụ lượng request lớn tăng đột ngột ramdom trong ngày mà bạn không đoán trước được thời gian nào.

Reserved Instances

Amazon EC2 Reserved cung cấp cho bạn mức chiếc khấu lên đến 75% so với On-Demand Instance. Khi chúng ta có một ứng dụng chạy dài hạn 1-3 năm và chúng ta có thể dự đoán được khả năng tính toán (compute) của instance thì loại instance này là phù hợp để tiết kiệm chi phí.

Spot Instances

Amazon EC2 Spot instances allow you to request spare Amazon EC2 computing capacity for up to 90% off the On-Demand price.

Amazon EC2 Spot Instances cho phép bạn tận dụng EC2 capacity chưa được sử dụng trên AWS cloud. Nói cách khác, là có thể sử dụng hàng ngon với giá rẻ. Khi sử dụng loại instance này, bạn phải chấp nhận việc các xử lý có thể bị gián đoạn (interrupted). và EC2 bị terminated.
Tham khảo thêm tại:
https://docs.aws.amazon.com/AWSEC2/latest/UserGuide/using-spot-instances.html
https://docs.aws.amazon.com/whitepapers/latest/cost-optimization-leveraging-ec2-spot-instances/when-to-use-spot-instances.html

Dedicated Hosts

Giống như cái tên, Nó là một physical EC2 server dành riêng cho bạn. Dedicated Hosts giúp bạn giảm chi phí bằng cách cho phép bạn sử dụng các software licenses như Windows server, SQL server v.v... đang có.
Tìm hiểu thêm tại: https://aws.amazon.com/ec2/dedicated-hosts/

Tài liệu tham khảo

https://aws.amazon.com/ec2/pricing/?nc1=h_ls
https://cuongquach.com/tim-hieu-ve-amazon-ec2-amazon-elastic-compute-cloud.html

Câu hỏi mẫu

uc?id=1YNMQgqbmme-PyR82rhFQXgHQnIRjWGar&export=download
uc?id=1a3JuwyQSL8rt_Zy511WWfUmFl_4KHaJV&export=download

Migrating Data to the Cloud

Trong rất nhiều tình huống được đưa ra, đa phần sẽ có các caai hỏi liên quan đến việc migrate data từ on-premise lên AWS cloud. Mình sẽ tổng hợp lại một số cách thức và chỉ ra điểm lưu ý ở các service này.

Online data transfer

AWS Virtual Private Network
  • Thiết lập nhanh
  • Chi phí thấp
  • Không đảm bảo băng thông ổn định, và mức độ bảo mật không cao
AWS Database Migration Service
  • Database của bạn vẫn hoạt động bình thường trong lúc tranfer
  • Chuyển và phân tích data nhạy cảm
  • Đơn giản, tự động và tăng tốc
AWS Direct Connect
  • Thiết lâp kết nối private chuyên dụng với cáp quang 1G hoặc 10G
  • Sử dụng khi chúng ta cần 1 kênh nhanh, tin cậy và bảo mật để truyền dữ liệu
  • Tốn chi phí và mất nhiều thời gian set up hơn so với VPN
  • Với chi phí và thời gian cần thiết để thiết lập, nó không phải là một tùy chọn truyền dữ liệu lý tưởng nếu bạn chỉ cần nó để thực hiện di chuyển một lần.
AWS S3 Transfer Acceleration

Nếu bạn đang chuyển dữ liệu của mình sang nền tảng lưu trữ AWS phổ biến S3 ở một khoảng cách xa, thì AWS S3 Transfer Acceleration giúp bạn thực hiện nhanh hơn: trung bình nhanh hơn 171%, theo AWS.

  • Nhanh chóng, an toàn thông qua public internet
  • Tiết kiệm thời gian khi chuyển data từ các location khác nhau
  • Dữ liệu được truyền thông qua Amazon CloudFront - tối đa hóa băng thông
AWS DataSync

uc?id=1EOQlvi9XQLn-RngKnKd_4RwY5c4s9W8B&export=download
Nguồn: https://aws.amazon.com/datasync/?whats-new-cards.sort-by=item.additionalFields.postDateTime&whats-new-cards.sort-order=desc

Offline data transfer

AWS Snowball

AWS Snowball là em bé của gia đình Snowball: một thiết bị siêu bền, có kích thước bằng vali, có thể được tải lên tới 80TB dữ liệu.

  • 50 - 80TB
  • Mã hóa 256 bit
  • Encryption keys được quản lý thông qua AWS Key Management Service (KMS)
AWS Snowball Edge

Có kích thước lớn lơn Snowball với khả năng tải lên tới 100TB. Snowball Edge cũng có thể chạy các ứng dụng dựa trên Lambda và EC2, ngay cả khi không có kết nối mạng.

Điều này làm cho nó lý tưởng cho các trường hợp sử dụng cần xử lý hoặc phân tích cục bộ trước khi dữ liệu được đưa lên AWS Cloud.
Giá của nó dĩ nhiên sẽ đắt hơn Snowball.

AWS Snowmobile

AWS Snowmobile là một giải pháp di chuyển dữ liệu quy mô exabyte, đóng gói tương đương với 1.250 thiết bị AWS Snowball vào container vận chuyển dài 45ft.

AWS Snowmobile có thể vận chuyển tới 100PB dữ liệu trong một chuyến đi, với chi phí chỉ bằng 1/5 chi phí chuyển dữ liệu qua kết nối internet tốc độ cao.
Snowmobile không chỉ là cách nhanh nhất và rẻ nhất để chuyển lượng dữ liệu khổng lồ lên cloud, nó còn có tính bảo mật cao.
Nhân viên an ninh chuyên dụng, theo dõi GPS, giám sát báo động và giám sát video 24/7 phối hợp với nhau để giữ an toàn cho dữ liệu của bạn trong suốt hành trình. Dữ liệu được mã hóa bằng các khóa mã hóa 256 bit.

Tài liệu tham khảo

https://www.jeffersonfrank.com/aws-blog/aws-data-transfer-costs/#AWSDC
https://www.slideshare.net/AmazonWebServices/migrating-data-to-the-cloud-exploring-your-options-from-aws-stg205r1-aws-reinvent-2018

Câu hỏi mẫu

uc?id=1g2vBgJnAkk2AWfpwGJnUDc6hKxt-nCJ-&export=download
uc?id=1P32t5JmKvv7_2_fKoVJZn61B1n-WrNhR&export=download

Lời kết

Ở phần 1 này mình tạm thời memo lại bấy nhiêu thôi, mình không chắc những cái mình memo ở đây đầy đủ và chính xác, quan điểm của mình là đưa ra các chủ đề có trong bài thi và những điểm mập mờ cần làm rõ để phân biệt các service và khi nào nên sử dụng cái nào. Lượng kiến thức dành cho bài thi này không đến mức chuyên sâu nhưng trãi đều các nội dung. Nắm vững khái niệm, khi nào sử dụng và một số lưu ý để so sánh giữa các service giống nhau sẽ là chìa khóa để bạn chinh phục bài test này. Trên cả việc pass chứng chỉ hay không pass chứng chỉ đó là kiến thức bạn nắm được, hiểu được để có thể vận dụng trong thực tế, vì vậy sẽ hoàn hảo hơn khi chúng ta tìm hiểu các service này ở một mức độ tương đối chứ không qua loa.
Nếu các bạn có gặp các câu hỏi nào hay service này cần thảo luận, hãy để lại comment và chúng ta cùng thảo luận nhé.