We are currently processing huge amount of sensitive corporate data for a Fortune 500 company as the first phase of a project. 저희는 현재 거액의 민감한 기업 데이터를 처리 포춘 500 대 기업 프로젝트의 첫 단계로합니다. You have to be very careful in data processing, much more than any standard programming effort. 매우 조심을해야합니다적인 데이터 처리를 더 많이보다 더 표준 프로그래밍의 노력합니다. Here are few tips you may find useful when programming to process sensitive data in bulk. 여기에서 힌트를 처리할 수있습니다 민감한 데이터를 대량으로 프로그래밍 때 유용합니다. Get your best (wo)men on the job. 당장 최고의 (wo) 남자가 직장에서합니다.

Institute a policy of random manual check. 연구소하는 정책을 임의의 수동으로 확인합니다. It may not be feasible to manually verify all or even most of the data. 그것을 수동으로 실행되지 않을 수있습니다 전부 또는도 대부분의 데이터를 확인합니다. However you must rigorously check a significant random subset of data from every batch. 그러나 중요한 임의의 하위 집합을하셔야합니다에서 데이터를 엄격하게 검사하는 모든 일괄 처리합니다. You will be surprised how much you can discover about the data as well as any errors by this simple step. 당신은 놀랄만한 데이터를 얼마나하실 수있습니다뿐만 아니라 모든 오류를 발견하여 내용이 간단한 단계를합니다.

Program safely not optimally. 최적의 프로그램을 안전하게없습니다. You must program safely; this is not the time to think about optimizations. 프로그램을 안전하게해야합니다; 지금은 시간이없는 최적화를 생각합니다. Data accuracy is your primary concern. 귀하의 기본 데이터의 정확성이 우려합니다. Performance isn’t normally an issue. 의 성능에 문제가 정상적으로합니다. Name the variables clearly and accurately to help with code review. 이름을 매개 변수를 명확하고 정확하게에 도움이 코드를 검토합니다.

Write down your logic in pseudo-code. 귀하의 로직을 적어 의사 - 코드합니다. Code review yourself at least twice and get at least one other person to do it in details. 코드 검토 자신 적어도 최소한 하나의 다른 사람을 두 번 가서 일만에 세부 사항을합니다. It is very easy to miss little details while coding. 그것은 매우 간단합니다 미스 리틀 세부 사항을 코딩하는 동안합니다. Finding such errors are easy in normal application development. 이러한 오류는 일반적으로 응용 프로그램 개발을 쉽게 발견합니다. Finding little logical errors in huge amount of data is next to impossible. 작은 논리적인 오류를 발견 옆에있는 거대한 양의 데이터가 불가능합니다.
Thoroughly code review your final code after you are done with at least one or more senior programmers. 철저하게 코드를 검토하여 최종 코드를 마친 다음에는 적어도 하나 이상의 수석 프로그래머를 완료합니다.

Extensively test with a small subset of data. 작은 부분 집합의 데이터를 광범위하게 테스트를합니다. Repeat the process with two or more of such set. 두 개 이상의 같은 과정을 반복하여 설정합니다.

Get your data experts to manually review the generated data. 당장 데이터를 전문가를 수동으로 검토하여 데이터를 생성합니다. They can find smell faster than anyone else. 그들은 다른 누구보다 빨리 냄새를 찾을 수있습니다.

I cannot over-stress the importance of writing quality unit tests for such projects. - 스트레스의 중요성을 할 수 끝나지의 품질 유닛 테스트를 작성 그러한 프로젝트를합니다. However you should also write tests to independently verify the generated / uploaded data. 그러나 여러분은 또한 개별적으로 확인하는 테스트를 작성 생성 / 업로드한 데이터를합니다. Get input for such tests from the domain experts. 도메인 전문가 get 입력이 같은 테스트를합니다. Do not compromise at all on testing. 이 테스트를 전혀 타협하지 않지.

Use a strongly typed language like Java. 자바처럼 강력하게 입력된 언어를 사용합니다.

Last but not the least you should get your most experienced developers on the job. 마지막으로하지만 대부분의 경험이있는 최소한의 개발자를 잡아야가 직장에서 귀하합니다. Bulk data processing and mining is a different ball-game than standard application development. 대량의 데이터 처리 및 마이닝은 다른 공 - 게임보다 표준 응용 프로그램 개발을합니다.