ECS Fargate 대비 EKS가 진짜 해결한 것 정리 중
가설Fargate보다 싸서가 아니라 운영 정책을 직접 설계하고 증명하기 위해 EKS를 쓴다.
비용 절감운영 선택지플랫폼 역량
주의RDS 커넥션, DB 병목, 컨트롤플레인 고정비는 EKS가 자동으로 해결하지 않는다.
여기서 틀어지면 뒤의 모든 구현이 "그럴듯한 도구 붙이기"가 된다. EKS의 이득은 단순 비용보다 GitOps, 보안 경계, 스케줄링, 관측성, 장애 실험을 직접 설계할 수 있다는 점에 있다.
이 단계 문제는 난이도보다 파괴력이 크다. 해결은 어렵지 않아도, 놓치면 Terraform이 현실을 다르게 해석한다.
권한은 문제 원인이면서 해결 경로다. 빠른 CLI 수습과 Terraform 영속 조치 중 무엇을 선택했는지가 팀 운영 원칙을 드러낸다.
이 단계부터 EKS가 어려워진다. 파일이 있어도 controller가 없으면 아무 일도 안 하고, controller가 있어도 IAM/SG/용량이 맞지 않으면 현실이 안 된다.
terraform-aws-modules/eks/aws//modules/karpenter 커뮤니티 모듈을 썼다. 이 모듈은 cluster SG에 karpenter.sh/discovery 태그를 자동 부착하고, Karpenter 릴리즈와 동기화된 IAM 권한 목록을 번들로 가진다.aws_ec2_tag), v1 신규 IAM 권한(Instance Profile CRUD) 별도 파악 필요.waypoint.yaml을 양쪽에서 수정해 infrastructure.replicas 필드를 한쪽이 제거하고 다른 쪽이 복구하는 충돌 발생.마지막 단계에서는 "고쳤는데 왜 안 바뀌지?"와 "떴는데 왜 죽지?"가 갈린다. 여기서부터는 배포 자동화보다 앱과 플랫폼 사이의 계약이 핵심이다.
문제를 발견하고 원인을 파악했다는 것이 이미 절반이다. 다음 terraform apply에서 아래 항목을 순서대로 잠그면 오늘의 루프가 끊긴다.
securityGroupSelectorTerms가 cluster SG를 선택하지 못함. 태그가 없어서.kubectl explain gateway.spec.infrastructure → 필드 있으면 유지, 없으면 제거.