개발 및 연구 정보

Mahout를 이용한 기계학습 프로그래밍

바보천사 2012. 10. 15. 13:04

윈도우 환경에서 Apache Mahout를 이용한 프로그래밍 환경 설정 및 방법에 대한 포스팅 입니다.


1. Mahout 다운로드

- 아파치 공식 사이트에서 다운로드

- 단, java와 하둡 버젼을 고려해서, 문제 없는 버젼으로..

2. 컴파일/설치

- 하둡과 마찬가지로, 시그윈에 풀더 하나 자리 잡아 압축 풀면 끝

단, 실행시, mahout jar 파일들, lib내 jar 파일들 임포트 해야 하는데

일반적으로 하둡 실행시 실행하게 되므로,

나의 경우에는, hadoop 실행 파일을 찾아 실행 파일 아래쪽에

mahout jar파일들을 CLASSPATH에 추가 하는 스크립트를 추가

요렇게 하면, hadoop 실행시, 자동으로 임포트 됨

- 소스 개발을 하고 싶다면, 소스 버젼 다운로드 받아서, mvn 으로 컴파일 필요

  (난, 요건 안하고 싶으므로, 패스....)

3. 이클립스에서의 개발

- 하둡과 마찬가지로, mahout jar 파일들, lib내 jar 파일들 임포트 시키고 개발 하면 됨

4. 실행 테스트

- 개발 후, 시그윈에 jar 파일 옮겨 놓고, 실행 테스트

- 일반적으로, hadoop 과 연동해서 하므로, 2번 과정을 꼭 거쳐야 함