Case Study «TXM» : unstructured text mining

inputLineSeqNo	LineTokenSeqNo	TokenCode	TokenText	TrainingLabel
0	0	TT_EOL	N/P	TT_EOL
1	0	TT_WORD	WHEAT-SRW	PRODUCT_NAME
1	1	ASCII45	-	ASCII45
1	2	TT_WORD	CHICAGO	TT_WORD
1	3	TT_WORD	BOARD	TT_WORD
1	4	TT_WORD	OF	TT_WORD
1	5	TT_WORD	TRADE	TT_WORD
1	6	TT_WORD	Code-001602	PRODUCT_CODE
1	7	TT_EOL	N/P	TT_EOL
...
4	1	ASCII58	:	ASCII58
4	2	TT_WORD	Reportable	/Reportable
...
6	7	ASCII58	:	ASCII58
6	8	TT_WORD	Managed	/Managed
6	9	TT_WORD	Money	TT_WORD
6	10	ASCII58	:	ASCII58
...
7	11	ASCII58	:	ASCII58
7	12	TT_WORD	Long	LONG_HEADER
7	13	ASCII58	:	ASCII58
7	14	TT_WORD	Short	SHORT_HEADER
7	15	TT_WORD	:Spreading	TT_WORD
...
11	7	TT_NUM	14141	TT_NUM
11	8	TT_NUM	58776	MMLONGVAL
11	9	TT_NUM	185100	MMSHORTVAL
11	10	TT_NUM	70898	TT_NUM
...
35	8	TT_NUM	54.5	TT_NUM
35	9	TT_EOL	N/P	TT_EOL
36	0	TT_EOL	N/P	TT_EOL
...
73	0	TT_WORD	WHEAT-HRSpring	PRODUCT_NAME
73	1	ASCII45	-	ASCII45
73	2	TT_WORD	MINNEAPOLIS	TT_WORD
73	3	TT_WORD	GRAIN	TT_WORD
73	4	TT_WORD	EXCHANGE	TT_WORD
73	5	TT_WORD	Code-001626	??? (expected prediction label: PRODUCT_CODE)
73	6	TT_EOL	N/P	TT_EOL

¶ Summary