2007/05/14 13:39
Dev 노트
(금일 5.14 월요일 공식적인 보도자료 배포에 따라, 숨겨놨던 포스팅을 다시 오픈합니다.^^
신비주의 전략이라는..ㅡ_ㅡ;;;;;)
Daum웹검색(베타)서비스가 오픈하였습니다. 익히 알고 계시는 구글쿼리 결과를 보여주는 웹검색이 아닙니다. 힘들었습니다. 그리 길지 않은 시간이 주어진채 웹검색이라는 거대한 주제를 개발해 내기란 만만한 일이 아니더군요.. 개발자의 알량한 자존심일지는 몰라도, 무언가 아직 부족하다는 느낌을 지울수 없지만, 제법 찾아주는 녀석을 오픈하게 되서 뿌듯합니다.
이제부터는 여러분과 함께 만들어 가야 합니다. 돠주십셔~~
베타서비스 의견나누기 게시판에 의견을 남겨주십셔.. 검색 결과가 불만족스러우실때, 꼭 포함되어야 할것 같은 웹페이지가 검색에 걸려나오지 않을때, 원하는걸 찾을수 있어서 좋았을때, 어떤 것이라도 좋습니다. 채찍도 좋고 격려도 좋습니다.
짧은 기간내에 욕심을 부려선 안되겠지만, 최대한 빠른 시간내에, 여기저기 검색하고 헤매실 필요 없도록 진화할 것을 약속드립니다. "다음에서 찾으면 될거를 왜 여기저기 찾아다니냐?"라고 모든 분들이 말씀하시는 날이 오도록 하는게 저의 비전입니다. 물론 저희 팀도..^^


또 하나, likejazz님이 DNA에서 살짝 귀띔하신 바와 같이, 웹검색 서비스를 위한 대부분의 코드를 파이썬으로 만들었습니다. 안정적이면서도, 고객의 목소리에 민첩하게 반응하는 서비스가 되도록 하는데 파이썬은 많은 도움을 줄 것으로 믿습니다.^-^
서울 다녀오느라 포스팅이 늦었습니다.ㅎㅎ;;;
글고 스샷은 likejazz님이 뜨신겁니다.케케케;;;;;; 귀차니즘의 발동으로 인하여;;;;;;
아참!! DNA를 통해서 제가 알리고 싶었는데, likejazz님께서 알려주셨네요. 고맙습니다^^
이틀동안 운전하느라 힘들어씀다..ㅡ_ㅡ;;;
-----
덧.
몇몇 분들께서 말씀하신 저희 웹검색의 부족한점에 대한 짧은 해명을 덧붙입니다.
우선 랭크에 대한 지적이 가장 많은거 같군요.. 저희 검색결과의 랭크 알고리즘의 가장 밑바탕이 되는 아이디어는 구글의 그것과 같습니다. "많이 참조되는 논문일수록 중요도가 높다"라는 내용의 논문에서 시작하는 것이죠.. 누구나 웹에 글을 쓰고 데이터를 생산해 내는 UCC의 시대에 집단지성을 가장 잘 반영할수 있는 모델이라고 생각합니다. 다만, 악용의 우려가 있어 외부참조 그 외에 많은 저항장치를 두고 있는데, 구글에서는 약 500여가지의 저항변수가 Pagerank(TM)의 악용을 방지하는데 쓰인다고 합니다. 저희 랭크 모델 역시 이러한 저항변수가 도입되어 있고, 이 부분은 구체적인 내용을 이런 자리에서 공개해 드릴수는 없습니다.
요컨데, 현재 검색결과에 나오는 랭크는 아직 충분히 웹문서들의 얽히고설킨 관계가 반영되지 못한 부분이 있고, 이것은 시간만이 해결해 줄수 있습니다. 시간이 지날수록 중요도가 높은 문서는 자연히 검색결과 위로 올라올 것이고 상대적으로 중요도가 떨어지는 문서는 검색결과 아래로 내려갈 것입니다. 여기서 "중요도"의 판단 근거 등은 이곳에서 공개해 드릴수 없는 점은 이해해 주실거라 믿습니다. 그리고 "중요도"라 함은 검색결과 랭크의 다른 말이 아닙니다.
두번째 지적되는 검색결과에 존재하지 않는 "좋은" 웹문서들입니다.
이것 역시 아직 충분한 시간동안 문서를 수집하지 못했기 때문에, 저희 웹검색을 사용해 보신 모든 분들이 필요로 하는 모든 페이지를 검색결과로 담고 있지 못합니다. 이점 역시 시간이 해결해 줄 것입니다.
써놓고 보니 무턱대고 기다리라는말로 들릴수도 있겠군요..ㅡ_ㅡ;;;
하지만 최대한 빠른 시간안에 최대한 다양한 웹문서를 검색 노출의 대상으로 올리고 최대한 공정하게 검색 결과 노출 순위를 결정하기 위해 개발하고 있다는 점은 믿어주시길 부탁드립니다.
돠주십셔(_ _);;
신비주의 전략이라는..ㅡ_ㅡ;;;;;)
Daum웹검색(베타)서비스가 오픈하였습니다. 익히 알고 계시는 구글쿼리 결과를 보여주는 웹검색이 아닙니다. 힘들었습니다. 그리 길지 않은 시간이 주어진채 웹검색이라는 거대한 주제를 개발해 내기란 만만한 일이 아니더군요.. 개발자의 알량한 자존심일지는 몰라도, 무언가 아직 부족하다는 느낌을 지울수 없지만, 제법 찾아주는 녀석을 오픈하게 되서 뿌듯합니다.
이제부터는 여러분과 함께 만들어 가야 합니다. 돠주십셔~~
베타서비스 의견나누기 게시판에 의견을 남겨주십셔.. 검색 결과가 불만족스러우실때, 꼭 포함되어야 할것 같은 웹페이지가 검색에 걸려나오지 않을때, 원하는걸 찾을수 있어서 좋았을때, 어떤 것이라도 좋습니다. 채찍도 좋고 격려도 좋습니다.
짧은 기간내에 욕심을 부려선 안되겠지만, 최대한 빠른 시간내에, 여기저기 검색하고 헤매실 필요 없도록 진화할 것을 약속드립니다. "다음에서 찾으면 될거를 왜 여기저기 찾아다니냐?"라고 모든 분들이 말씀하시는 날이 오도록 하는게 저의 비전입니다. 물론 저희 팀도..^^
Daum 웹검색(베타) 대문
몽땅 파이썬으로 개발되었습니다.
또 하나, likejazz님이 DNA에서 살짝 귀띔하신 바와 같이, 웹검색 서비스를 위한 대부분의 코드를 파이썬으로 만들었습니다. 안정적이면서도, 고객의 목소리에 민첩하게 반응하는 서비스가 되도록 하는데 파이썬은 많은 도움을 줄 것으로 믿습니다.^-^
서울 다녀오느라 포스팅이 늦었습니다.ㅎㅎ;;;
글고 스샷은 likejazz님이 뜨신겁니다.케케케;;;;;; 귀차니즘의 발동으로 인하여;;;;;;
아참!! DNA를 통해서 제가 알리고 싶었는데, likejazz님께서 알려주셨네요. 고맙습니다^^
이틀동안 운전하느라 힘들어씀다..ㅡ_ㅡ;;;
-----
덧.
몇몇 분들께서 말씀하신 저희 웹검색의 부족한점에 대한 짧은 해명을 덧붙입니다.
우선 랭크에 대한 지적이 가장 많은거 같군요.. 저희 검색결과의 랭크 알고리즘의 가장 밑바탕이 되는 아이디어는 구글의 그것과 같습니다. "많이 참조되는 논문일수록 중요도가 높다"라는 내용의 논문에서 시작하는 것이죠.. 누구나 웹에 글을 쓰고 데이터를 생산해 내는 UCC의 시대에 집단지성을 가장 잘 반영할수 있는 모델이라고 생각합니다. 다만, 악용의 우려가 있어 외부참조 그 외에 많은 저항장치를 두고 있는데, 구글에서는 약 500여가지의 저항변수가 Pagerank(TM)의 악용을 방지하는데 쓰인다고 합니다. 저희 랭크 모델 역시 이러한 저항변수가 도입되어 있고, 이 부분은 구체적인 내용을 이런 자리에서 공개해 드릴수는 없습니다.
요컨데, 현재 검색결과에 나오는 랭크는 아직 충분히 웹문서들의 얽히고설킨 관계가 반영되지 못한 부분이 있고, 이것은 시간만이 해결해 줄수 있습니다. 시간이 지날수록 중요도가 높은 문서는 자연히 검색결과 위로 올라올 것이고 상대적으로 중요도가 떨어지는 문서는 검색결과 아래로 내려갈 것입니다. 여기서 "중요도"의 판단 근거 등은 이곳에서 공개해 드릴수 없는 점은 이해해 주실거라 믿습니다. 그리고 "중요도"라 함은 검색결과 랭크의 다른 말이 아닙니다.
두번째 지적되는 검색결과에 존재하지 않는 "좋은" 웹문서들입니다.
이것 역시 아직 충분한 시간동안 문서를 수집하지 못했기 때문에, 저희 웹검색을 사용해 보신 모든 분들이 필요로 하는 모든 페이지를 검색결과로 담고 있지 못합니다. 이점 역시 시간이 해결해 줄 것입니다.
써놓고 보니 무턱대고 기다리라는말로 들릴수도 있겠군요..ㅡ_ㅡ;;;
하지만 최대한 빠른 시간안에 최대한 다양한 웹문서를 검색 노출의 대상으로 올리고 최대한 공정하게 검색 결과 노출 순위를 결정하기 위해 개발하고 있다는 점은 믿어주시길 부탁드립니다.
돠주십셔(_ _);;


