조금 늦은 감이 있지만 2024년 회고록 작성합니다.2024년은 정말 다사다난했습니다.마치 앞만 보고 달리는 경주마처럼 성장과 배움에 목말라있던 한 해 였습니다. 불안함과 긴장속에서 스스로를 마구 채찍질 해 온 것 같습니다.숙원사업이었던 취업도 했구요. 이제 드디어 사회에 한 발을 내딛은 것 같습니다.2023년 12월 인공지능연구원에서 연구원 전환이 되지 못하고 연장된 인턴신분으로 계약을 종료하게 되었을때, 2024년 앞으로가 막막했습니다.어떻게 시작해야할 지 몰랐거든요. 더 깊은 공부가 필요하다고 생각되어 대학원도 알아보기도 하고, 여기저기 취업 원서도 넣어봤습니다.제게 돌아온 건 서류 탈락…읽지 않은 메일..24년도 초반은 그렇게 어둡고 막막한 상반기를 보낸 것 같아요.연구원 재직 당시 팀장님께 들은..
로컬에서 오픈소스 모델을 사용하기 위해 종종 다양한 LLM 서빙 툴들을 사용합니다.가장 대중적이면서 접근하기 쉬운 것으로 Ollama가 있죠. Ollama 에서는 Docker와 같이 model 을 pull 하여 Ollama hub에 있는 모델을 로컬 환경에 다운받아 올 수 있습니다. 이 것이 아니라면 직접 로컬 환경에서 gguf 파일과 Modelfile을 이용하여 Ollama list에 업데이트 해줄 수 있습니다. (로컬 환경 제한적) 그럼 내가 학습하고 경량화 한 모델을 Push 하려면 어떻게 해야할까요? Ollama 사이트 회원 가입https://ollama.com/ OllamaGet up and running with large language models.ollama.com우선 Ollama 사이..
Audio샘플링 속도 (Sampling Frequency)1초 동안 수집된 샘플의 수로, 헤르츠(Hz) 단위로 측정됨음성 모델 학습에 주로 쓰이는 샘플링 속도는 16000Hz(16kHz)신호에서 얼마나 큰 주파수까지 캡쳐할 수 있는지를 결정하는데 큰 역할신호에서 캡쳐 가능한 최고 주파수의 한계는 샘플링 속도의 절반 = Nyquist Limit더 높은 샘플링 속도를 사용하여도 얻을 수 있는 추가 정보는 없을 것이며, 오히려 파일 처리에 대한 계산 비용만 증가시킴너무 낮은 샘플링 속도는 정보의 손실로 이어짐모든 예제가 동일한 샘플링 속도로를 가지고 있는지 확인하는 것이 중요Resampling : 서로 다른 샘플링 속도를 일치시켜주는 작업 ➡ 오디오 전처리 과정 중 하나Bit-Depth : 특정 시점의 오디오..
밴디트는 오락실의 슬롯머신을 의미합니다.슬롯 머신의 목표는 코인을 최대한 많이 얻는 것이죠! 밴디트 문제에서는 무작위성에 현혹되지 않게 '기댓값'을 기준으로 평가합니다.만약 각 슬롯 머신의 가치(보상 기댓값)을 알면 플레이어는 가장 좋은 슬롯 머신을 고를 수 있음하지만 실제로는 슬롯머신의 가치를 모름각 슬롯 머신을 돌려보며 가치를 추정 (가능한 정확하게) 해야 함따라서 밴디트 문제에서는 greedy 알고리즘과 epsilon 탐색을 통한 문제 풀이를 진행합니다. Bandit Problem 플레이어는 가치 추정치가 가장 높은 머신을 선택해야 합니다. (Greedy Policy 이용)exploitation : 지금까지 실제로 플레이 한 결과를 바탕으로 가장 좋다고 생각되는 슬롯 머신을 플레이(greedy)ex..
SLT 2024에 소개된 Audio(ASR Task)와 LLM을 결합한 내용의 논문입니다.기존의 ASR 태스크에서 Rare word에 대한 인식 성능을 향상시키기 위해 Language Model을 사용했는데요,논문을 읽고 간단히 정리해보았습니다. 원문과 깃헙 코드는 아래 링크에서 확인할 수 있습니다. https://github.com/X-LANCE/SLAM-LLM GitHub - X-LANCE/SLAM-LLM: Speech, Language, Audio, Music Processing with Large Language ModelSpeech, Language, Audio, Music Processing with Large Language Model - X-LANCE/SLAM-LLMgithub.comhtt..
클론 폴더 경로 생성mkdir "폴더 이름"cd "폴더 이름" Git 저장소 초기화git init (1)에서 생성한 디렉토리를 git 저장소로 변환 Sparse Checkout 기능 활성화git config core.sparseCheckout true = git 저장소에서 특정 파일이나 디렉토리만을 선택적으로 체크아웃 할 수 있도록 해줌 Remote Repository 연결git remote add -f origin "remote repository url" Git Checkoutecho "remote repository 폴더 경로" >> .git/info/sparse-checkout 해당 폴더 경로만을 따와 sparse checkout을 진행해줍니다. Git Pullgit pull origin ma..