[LeetCode] 49. Group Anagrams(정렬하지 않고 풀 수 있지 않을까?) [LeetCode] 49. Group Anagramshttps://leetcode.com/problems/group-anagrams입력값으로 주어진 문자열에서 애너그램끼리 그룹화한 결과를 반환하는 것이 문제의 요구사항이다. 문자를 구성하는 철자의 개수, 즉 구성이 동일하다면 같은 그룹에 속한다. 1. 시작점: 정렬 없이 풀 수 있을 거라 생각했다애너그램 단어들은 정렬을 하면 같은 문자열이 된다. 따라서 정렬 후 같은 문자가 되는지 여부를 판단하여 제출하면 된다. 일반적인 모범답안은 아래와 같다(출처: 파이썬 알고리즘 인터뷰).import collectionsclass Solution: def groupAnagrams(self, strs: List[str]) -> List[List[str]]: .. 2025. 4. 13. [Python] Sorted()에서 key 정렬 기준에 따라 속도가 달라지는 이유 Python sorted()와 key 정렬기준 최적화 과정 1. 들어가기에 앞서들어가기에 앞서 말하자면 이 글은 가설을 세우고 다시 정정하는 과정을 담고 있다. 따라서 가설이 맞다고 생각하면서 읽기보다는, 그 과정에서 어떤 오류가 있었는지를 살펴보면 더 유용할 것이다. 2. sorted()에서 같은 정렬 기준을 사용했는데, 실행 속도가 다르다코딩 테스트 문제 리트코드937 - 로그 파일 재정렬을 풀다가 예상보다 정렬 속도가 느리게 나오는 경우를 발견했다. 교재에 있는 답안을 그대로 제출했더니 전체 제출된 답안의 런타임 중에 좌측과 같은 분포가 나타났고, 그 후 다른 답안을 참고하여 sorted()의 key 파라미터를 수정하여 제출했더니 우측의 분포가 나타났다.내가 참고한 교재에서는 정렬 시 아래와 같은 .. 2025. 3. 16. [대용량 이미지 태깅] 프로젝트 개요 및 향후 계획 + 수정예정 대용량 이미지 태깅 및 분석 기능 프로젝트해당 사이드 프로젝트는 이미지를 업로드하면 자동으로 태그를 생성하고, 나중에 쉽게 검색할 수 있도록 만드는 것이 핵심 기능이다.어떤 이미지?당시엔 유용하다고 생각하고 핸드폰에 저장한 스크린샷과 사진들은 많지만 그 정보들을 정리하는 일은 좀체 없다. 그간 쌓인 것을 수동으로 폴더를 정리하거나 검색하는 것도 역시 번거롭다. 대용량 이미지 태깅과 분석 프로젝트는 이렇게 개인의 핸드폰에 쌓여있는 스크린샷에 있는 데이터를 정리하고 유용하게 가공하는 것이 목표다. 모듈화하지만 대량의 이미지 데이터를 다루는 기능을 구현해내는 것 이상으로 확장성을 고려한 모듈화를 통해 변화하는 요구사항에 유연하게 대응할 수 있는 구조를 만들어보려 한다.처음부터 완벽한 시스템을 만드.. 2025. 3. 2. [대용량 이미지 태깅]대용량이미지 핸들링을 위한 클라우드 아키텍처 선택 : AWS Lambda와 S3의 활용 이미지 업로드 프로젝트를 클라우드에서 운영하려면 몇 가지 선택지가 있다. EC2를 띄우고, 직접 서버를 운영하는 방법이 가장 익숙한 방법이다. 하지만 이 방법은 유지보수 부담이 크고, 트래픽이 늘어나면 서버를 추가해야 한다. 무엇보다 EC2는 계속 켜져 있어야 하므로, 사용여부와 상관없이 지속적으로 비용이 발생한다. 클라우드를 쓰는 이유는 필요할 때만 사용하고, 불필요한 비용을 최소화하기 위해서다. 따라서 서버를 유지하지 않고도 이미지 업로드 및 처리가 가능한 구조를 고민하게 됐고, AWS Lambda와 S3 조합이 가장 현실적인 선택이라는 결론을 내렸다. 대용량 이미지 업로드를 위한 클라우드 아키텍처 선택 과정Lambda를 선택한 이유: 서버 없이 돌아가는 시스템Lambda를 선택한 이유는 단순하다. .. 2025. 2. 16. [MSSQL][SQL SERVER] SQL 성능 최적화: 캐싱과 동적 평가(Dynamic Evaluation)의 함정 연말연초라 그런지 프로그램 사용량이 늘어 성능 이슈가 늘었다. 업무상 성능 개선이 시급히 필요한 시점에서 SQL 튜닝을 하면서 새로 배운 점을 정리하고자 한다. (쿼리나 함수명, 변숫값은 예제로 새로 작성하였다.)문제의 쿼리: 병목WHERE a.Status LIKE '%' + @InputStatus + '%' -- 문제 부분실행계획을 분석해보니 위의 LIKE 연산자 조건 비교 부분에서 프로시저 전체의 56%에 달하는 비용이 발생하고 있었다. LIKE 연산자로 검색하려는 문자열의 앞에 '%'가 올 경우 인덱스를 활용하지 못한다. LIKE 조건에 일치하는 패턴을 찾아야 하는데 찾고자 하는 값이 문자열의 어느 부분에서 시작하는지 알 수 없으므로 전체를 스캔해야 하기 때문이다.@InputStatus는 'Orde.. 2025. 1. 5. 이전 1 2 3 4 ··· 9 다음