목록분류 전체보기 (234)
전산쟁이의 기억노트

perplexity에서 생성한 AI이미지 시작하는말안녕하세요, 고니입니다.OS 계정이 root가 아닌 일반 계정에서 kubectl을 사용할 인증정보가 없기 때문에 사용할 수 없습니다. 이를 해결하기 위한 절차를 기술합니다. 작업절차인증서 복사$> mkdir /home/{{ 계정명 }}/.kube$> /bin/cp /etc/kubernetes/admin.conf /home/{{ 계정명 }}/.kube/config$> chown -R {{ 계정명 }} /home/{{ 계정명 }}/.kube자동 갱신시 계정정보에도 반영* kubespray 기반에서 사용하는 경우 auth renew 기능이 활성화된 경우 갱신된 인증서가 일반 계정에는 복사되지 않기 때문에 해당 절차가 필요합니다$> cat /usr/local/b..

perplexity에서 생성한 AI이미지서비스 계정생성$> kubectl create sa testuserrole설정$> cat role.yamlapiVersion: rbac.authozation.k8s.io/v1kind: Rolemetadata name: ms-role namespace: msrules:- apiGroup: [""] resources: ["*"] verbs: ["get", "list", "watch"]rolebinding 설정$> rolebinding.yamlapiVersion: rbac.authorization.k8s.io/v1kind: RoleBindingmetadata: name: ms-rolebinding namespace: msroleRef: apiGroup: rb..

perplexity에서 생성한 AI이미지시작하는말안녕하세요, 고니입니다.kubernetes의 분산 저장소인 ETCD에 대해 설명하고자 합니다. ETCD는 메모리에 들어갈 수 있는 소량의 데이터를 보관하도록 설계된 저장소로 클러스터환경에서 사용합니다.ETCD는 'ɛtsiːdiː' 발음 한다고 합니다.기본적으로 2G의 용량이 필요하며, 최대 8G까지 사용가능하고 클러스터 멤버 구성은 이론상 제한은 없으나, Google을 참조하면 최대 7대까지 허용하되 5대 노드 구성을 권장한다고 합니다. (짝수로 구성된 노드는 Failover시 leader선출이 불가능합니다)운영ETCD의 Disk I/O가 증가하는 경우 Leader에서 제외될 수 있습니다. (Disk fsync의 업데이트 시간이 heartBeat Inte..
개인적으로 공부했던 부분이라 사실과 다르게 자의적인 해석이 있을수 있음 왜 옵저빌리티(observability)를 도입해야 하는가?서비스 장애시 기존에는 담당자의 경험으로 처리했으나, 컨테이너화 되면서 내부시스템은 복잡해졌고, 단순 모니터링으로는 이슈대응이 매우 어렵게 되었음목표는 내부시스템에 대한 자세한 정보를 기반으로 미래에 발생할 이벤트를 예측하고, 이런한 예측을 바탕으로 IT운영을 자동화 하는 것.(ef. 장애가 발생할 위험이 있으면 미리 예측하고 운영자에게 통보, 서비스에 필요한 리소스 증감을 미리 예측하는 것)단순 모니터링이 아닌 서비스간의 상관관계를 파악하고 상태 데이터를 기사화 함으로써 개발자, 운영자에게 빠른 의사결정을 할 수 있도록 도와주기 때문에 필요하다.옵저빌리티와 AI를 결합한 A..

들어가는 말안녕하세요, 고니 입니다. docker 기반에서 root volume이 100%차는 문제가 있어서 data경로를 이동시켰는데, 그 이후에 일부 컨테이너가 정상적으로 뜨지 않는 문제가 있었습니다. 추정원인과 해소 방법도 기재했으니 같은 문제로 고민하는 분들께 도움이 되었으면 좋겠네요 perplexity에서 생성한 AI이미지발생현상pod 구동될때 Imageinspecterror 메시지를 출력하면서 구동되지 않는 문제$> kubectl describe pod {{ pod명 }}...Events...Imageinspecterrordocker data root가 변경된 경우 일부 pod가 캐싱된 경로를 가지고 있어서 발생하는 것으로 보임 - Docker컨테이너 저장경로 변경방법조치방법docker 캐쉬..
발생현상 컨테이너 내부에서 통신시 호스트를 못찾는 문제가 있어서(WEB ->DB) 구동실패 원 인 Docker 내부에서 hosts를 찾지 않고 docker-dns.conf를 따라서 외부 DNS를 참조해서 리졸빙하는것으로 보임. 조치방법 docker-dns를 제외하고 구동. $> mv /etc/systemd/system/docker.service.d/docker-dns.conf /etc/systemd/system/docker.service.d/docker-dns.conf_ori $> systemctl daemon-reload $> systemctl restart docker Reference http://igoni.kr/books/linux/page/unknown-server-host 컨테이너 구동시 un..
사전 설명 k8s환경에서 특정 노드 제외할때 그냥 삭제해도 kube scheduling에 의해 재배치가 있긴하지만 계획된 정지 작업같은 작업이 있는경우 보다 안정적으로 노드를 제외하려면 cordon / drain 절차를 거치면 좋습니다. cordon / drain은 약간의 차이가 있는데, cordon의 경우 단순 스케쥴링을 제외하는 절차, drain의 경우 제외할 노드를 모두 제거하는 절차를 수행합니다. (drain은 cordon절차를 포함합니다.) 작업절차 cordon 설정 노드 정보 확인 $> kubectl get no NAME STATUS ROLES AGE VERSION masr1 Ready control-plane,master 37d v1.23.7 work1 Ready 37d v1.23.7 wor..

크롬브라우져에 공룡게임 있다는 사실을 알게되었는데..... 크롬 브라우져에서 chrome://dino를 입력하면 인터넷 연결을 끊지 않아도 할 수 있어요.ㅋㅋ 그리고 이건..ㅋㅋ 내 점수..ㅋㅋ reference http://igoni.kr/books/it/page/352fe 크롬브라우져에서 공룡게임하기 | igoni.kr 크롬브라우져에 공룡게임 있다는 사실을 알게되었는데..... 크롬 브라우져에서 chrome://dino를 입력하... igoni.kr
Jpub에서 발간한 사이트신뢰성 엔지니어링에 대해 읽고, 자체적으로 해석한 결론입니다. (정확하진 않을수 있습니다. 말 그대로 자체 해석...) 구매는 요기 - http://www.yes24.com/Product/Goods/57979286 SRE란? 구글에서 시스템의 안정성을 증가시키기 위해 활동하는 역활로, Devops보다 한단계 더 발전한 모델이라고 합니다. SRE역활 Site Reliability Engineer 의 약자로, 소프트웨어 엔지니어링과 IT인프라 운영 그 중간쯔음에서 일하는 역활로, in-house tool이나 오픈소스를 활용해 시스템의 안정성과 확장성을 유지하고 개선하는 업무 Devops/SRE의 업무 목표는 신속한 서비스 제공을 위해 기업문화, 자동화툴을 이용한 플랫폼 설계/구축 하..
kuebernetes DB격인 etcd의 member리스트를 제외한느 절차를 기술한다. 다중 마스터(3대로 구현)되어 있을때 특정 노드를 제외하는 방법이다. etcd memver list 확인 $> cd /usr/local/bin $> ./etcdctl.sh -w table endpoint status --cluter=true +----------------------+------+---------+----------+-----------+------------+------------+------------+--------------------+--------| | ENDPOINT | ID | VERSION | DB SIZE | IS LEADER | IS LEARNER | RAFT TERM | RAFT ..