커밋 관리하기
·
git&github
협업을 하다보면 github에 commit 을 하는 경우가 많은데, 이때 불필요하게 자주 commit 을 하거나알아보기 어려운 내용의 commit message를 작성하면 추후 문제가 생겼을 때 관리하기 어렵다. 그래서 한 단위의 작업을 하나의 버전에 내용 가능한 메시지와 함께 커밋을 해야 하고팀원끼리 합의된 방식을 잘 준수하여 일관된 형태의 commit 을 작성하는 것이 가장 중요하다. 특히 커밋 메시지를 작성하는 널리 사용되는 방식인 컨벤션이 있는데 형태는 아래와 같다.type : subjectbody(optional)footer(optional) 여기서 type은 해당 작업이 어느 부류에 속하는 지 바로 알 수 있도록 붙이는 태그를 의미한다. 예를 들어 feat 는 새로운 기능 추가, fix 는 버..
Git 문서 활용 및 각종 설정 진행하기
·
git&github
저번에는 Git의 여러가지 특성과 그에 따른 명령어에 대해 이해도를 설명했는데,이번에는 이런 Git의 문서를 활용하고 다양한 설정을 진행해보는 시간을 가지려고 한다.1. Git helpgit을 활용하면서 모르는 부분이 있을 때, git help를 사용하면 기본적인 명령어들과 설명을 볼 수 있다.더 많은 명령어를 확인하기 위해서는 git help -a 를 입력하면 Git의 모든 명령어를 볼 수 있다. 추가로 git 명령어 -h 를 입력하면 해당 명령어의 설명과 옵션을 확인할 수 있다.예를 들어 git commit -h 를 입력하면 commit이 언제 사용되는지, 어떤 옵션이 있는지 확인할 수 있다. 웹에서 확인하고 싶은 경우에는, git help 명령어 혹은 git 명령어 --help 를 입력한면 되는데 ..
Git의 강점과 특징
·
git&github
저번 포스팅까지 Git과 Github의 사용방법에 대해서 작성해보았다.이번에는 Git의 특별한 강점과 추가적인 깊은 내용을 포스팅 하려고 한다.1. Git의 강점첫번째로 Git은 VCS 중에서도 특별한 강점 두가지가 있는데, 스냅샷과 분산 버전 관리 시스템이이다. 첫 번째 강점인 스냅샷에 대해 설명하기 앞서 델타 버전을 언급해야 하는데 위 사진을 보면 델타 버전은 파일을 하나씩 별도로 보면서 차이점만 따로 관리하고 있다. 반면 스냅샷은 프로젝트 전체를 스냅샷 형태로 관리하되, 변경되지 않은 파일은따로 저장하는 것이 아닌, 기존에 저장되어 있던 파일에 링크만 걸어준다. 따라서 특정 버전의 파일을 불러올 때, 스냅샷 방식의 속도가 훨씬 빠르게 불러올 수 있다. 예를 들어 Version3 파일을 불러오고 싶..
Github 사용하기
·
git&github
0. Github이란?Github란 무엇일까? Github는 코드 공유 및 협업 서비스이다.Github 외에도 GitLab, Bitbucket등의 동종 서비스가 많지만 대중적으론 Github을 가장 많이 쓰인다. 특히 Git으로 관리하는 모든 프로젝트들을 온라인 공간에 공유하여프로젝트 구성원들이 함께 소프트웨어를 만들어낼 수 있도록 도와주는 서비스이다. 온라인 Git 저장소는 모든 업로드와 다운로드를 Commit 단위로 주고받는다.따라서 다른 사람이 완료한 작업을 Github에 등록하기 위해서는 반드시 최신버전을Local환경에 다운로드 받도록 강제되기 때문에 충돌을 방지할 수 있다. 또한 Github는 오픈소스의 성지라고도 불리는데, 전 세계에서 굉장히 많은 오픈소스 프로젝트들이Github에서 공유되고 ..
Git branch 넘나들기
·
git&github
1. 여러 branch 만들어보기 Git에서 프로젝트를 하나 이상의 모습으로 관리해야 할 때, 혹은 여러 작업들이 각각 독립되어 진행될 때여러 branch를 생성하여 하나의 프로젝트 폴더에서 관리할 수 있도록 만들 수 있다. 먼저 branch를 만드는 방법은 git branch "branch name" 이고, 브랜치 목록은 git branch를 입력하면 된다. 여기에서 branch 앞에 * 표시가 되어있거나 것이 현재 내가 보고 있는 branch 인데git switch "branch name" 를 입력하여 보고있는 branch가 main 에서 add-branch 로 변경되었다. SourceTree 를 살펴보면 branch 가 분리되지는 않았는데 그 이유는 두개의 브랜치가 같은 버전에 있기 때문이다. 그..
Git 을 활용하여 과거 데이터 가져오기.
·
git&github
저번 포스팅에 이어 Git 을 사용하여 변경사항을 추적하고 버전으로 기록하는 과정을 다뤄보려고 한다.이를 통해서 변경 내역을 버전으로 남기고, 잘못된 커밋을 되돌리는 방법까지 알아볼 수 있다.1. git add + commit git status 를 입력했을 때 나온 결과를 보면 "no commits yet" 은 아직 commit 이 없다는 뜻이고"Untracked files" 는 아직 Git이 관리한 적 없는 파일이라는 의미이다. 여기에서 Commit 을 버전이라고도 볼 수 있는데 이번에는 이 commit 을 추가하는 방법을 알아보려 한다. 먼저 "git add + 파일명" 을 입력하면 해당 파일을 commit 목록에 담는다는 의미이고,"git add . " 를 입력하면 현재 접근한 폴더 하위의 모든 ..
Git 시작하고 기본 설정하기
·
git&github
현업에서 꽤나 오랫동안 일을 하다보니 Git을 종종 사용하고는 한다.그러나 대부분 push, pull만 진행하고 변경사항에 대한 로그만 찾다보니까Git을 조금 더 잘 활용할 수 있는 방법이 있지 않을까 싶어 깊이 파고들어 보려고 한다. 0. Git이란?Git은 VCS 라는 종류의 프로그램들 중 하나로, Version Control System 의 약자이다. 프로그램에 유의미한 변화가 결과물로 나온 것을 버전이라고 하는데, 이 버전을 관리할 수 있는 시스템으로프로젝트 버전을 언제든지 되돌릴 수 있고, 프로젝트 내용 중 변경 사항들을 쉽게 이동할 수 있다.1. Git 설치하기먼저 사이트에서 Git Bash 를 설치한 뒤에 기본 설정 그대로 설치하면 되는데, 반드시 Git Bash 를 포함한다. 이후 Git..
HuggingFace 오픈소스 언어모델 활용한 RAG Pipeline 구성
·
RAG 을 활용하여 LLM 만들어보기
저번에는 HggingFace 오픈소스를 만들어봤는데, 이번 포스팅에서는HuggingFace 오픈소스 언어모델을 활용한 RAG Pipeline 구성을 진행해 볼 예정이다. 전체적인 흐름을 요약하자면, 아래와 같다.Word 문서에서 소득세 관련 정보 로드문서를 작은 청크로 분할다국어 임베딩 모델로 벡터화한국어 LLM으로 질문에 답변먼저 필요한 패키지는 아래와 같다.pip install -q langchain langchain-huggingface langchain-community langchain-core langchain-text-splitters bitsandbytes docx2txt langchain-chroma1. 문서 chunking 후 Database 생성.먼저 소득세 관련 Word 문서를 로드..