<aside>
💡 목차
- 최종 결과물 - 검색 종류 6가지
- Slack 연결
- Streamlit 연결
- Architecture
- 코드 설명
- Slack 한계
- Streamlit 연결
</aside>
1. 최종 결과물 - 검색 종류 6가지
a. Slack 연결
-
- 국내/이름/(.*?) - 찾고 싶은 국내 투자사 이름에 대한 정보 제공
-
- 국내/분야/(.*?) - 해당 분야가 포함되어 있는 모든 국내 투자사 검색
-
- 국내/키워드/(.*?) - 해당 키워드가 포함되어 있는 모든 국내 투자사 검색
-
- 해외/이름/(.*?) - 찾고 싶은 해외 투자사 이름에 대한 정보 제공
-
- 해외/분야/(.*?) - 해당 분야가 포함되어 있는 모든 해외 투자사 검색
-
- 해외/전체/(.*?) - 해당 키워드가 포함되어 있는 모든 해외 투자사 검색
b. Streamlit 연결
🔗 https://searchluck4.streamlit.app/
2. Architecture
-
Architecture Overview
- “혁신의 숲(국내 투자자 데이터)” & “Mercury(해외 투자자 데이터)” 크롤링
- [Cloud9 환경] 데이터 전처리
- 추후 검색을 위해 투자사에 해당하는 키워드 정리
- 정제된 데이터 → DynamoDB, Elastic 에 저장
- Slack & Streamlit 에 연결하여 서비스 제공
- Streamlit 사이트 배포
3. 코드 설명
-
데이터 수집 & 데이터 저장
[크롤링 코드 & 데이터 저장 리뷰] 결과1 & 결과2 는 같은 데이터를 사용함
-
Slack 연결
search_all_slack.py #slack연결
4. Slack 한계
- 슬랙봇에서 데이터를 키워드를 검색했을 경우 문제가 발생하는 순간을 발견
- 키워드 검색 결과의 경우, 전체 인덱스에서 키워드와 일치하는 모든 항목들을 모두 출력할 수 없는 것을 확인