public class BagOfWordsData
extends java.lang.Object
Modifier and Type | Field and Description |
---|---|
(package private) java.util.SortedSet<java.lang.String> |
classes
class labels
|
(package private) java.util.Map<java.lang.Integer,java.lang.Integer> |
docLengthMap
for tf-idf, length of each instance
|
(package private) java.util.Map<java.lang.Integer,java.lang.String> |
documentClasses
Map of instance id to class label
|
(package private) java.util.Map<java.lang.String,java.lang.Integer> |
idfMap
for tf-idf, term-document count map
|
(package private) java.util.Map<java.lang.Integer,java.util.SortedMap<java.lang.String,java.lang.String>> |
instanceNominalWords
instance nominal attribute values
|
(package private) java.util.Map<java.lang.Integer,java.util.SortedMap<java.lang.String,java.lang.Double>> |
instanceNumericWords
map if instance id to map of attribute name - value pairs
|
(package private) java.util.SortedMap<java.lang.String,java.util.SortedSet<java.lang.String>> |
nominalWordValueMap
nominal attribute names and values
|
(package private) java.util.SortedSet<java.lang.String> |
numericWords
numeric attribute labels
|
(package private) boolean |
tfIdf
should we perform tf-idf normalization?
|
Constructor and Description |
---|
BagOfWordsData() |
Modifier and Type | Method and Description |
---|---|
java.util.SortedSet<java.lang.String> |
getClasses() |
java.util.Map<java.lang.Integer,java.lang.Integer> |
getDocLengthMap() |
java.util.Map<java.lang.Integer,java.lang.String> |
getDocumentClasses() |
java.util.Map<java.lang.String,java.lang.Integer> |
getIdfMap() |
java.util.Map<java.lang.Integer,java.util.SortedMap<java.lang.String,java.lang.String>> |
getInstanceNominalWords() |
java.util.Map<java.lang.Integer,java.util.SortedMap<java.lang.String,java.lang.Double>> |
getInstanceNumericWords() |
java.util.SortedMap<java.lang.String,java.util.SortedSet<java.lang.String>> |
getNominalWordValueMap() |
java.util.SortedSet<java.lang.String> |
getNumericWords() |
boolean |
isTfIdf() |
void |
setClasses(java.util.SortedSet<java.lang.String> classes) |
void |
setDocLengthMap(java.util.Map<java.lang.Integer,java.lang.Integer> docLengthMap) |
void |
setDocumentClasses(java.util.Map<java.lang.Integer,java.lang.String> documentClasses) |
void |
setIdfMap(java.util.Map<java.lang.String,java.lang.Integer> idfMap) |
void |
setInstanceNominalWords(java.util.Map<java.lang.Integer,java.util.SortedMap<java.lang.String,java.lang.String>> instanceNominalWords) |
void |
setInstanceNumericWords(java.util.Map<java.lang.Integer,java.util.SortedMap<java.lang.String,java.lang.Double>> instanceNumericWords) |
void |
setNominalWordValueMap(java.util.SortedMap<java.lang.String,java.util.SortedSet<java.lang.String>> nominalWordValueMap) |
void |
setNumericWords(java.util.SortedSet<java.lang.String> numericWords) |
void |
setTfIdf(boolean tfIdf) |
boolean tfIdf
java.util.Map<java.lang.Integer,java.lang.String> documentClasses
java.util.SortedSet<java.lang.String> classes
java.util.SortedSet<java.lang.String> numericWords
java.util.Map<java.lang.Integer,java.util.SortedMap<java.lang.String,java.lang.Double>> instanceNumericWords
java.util.Map<java.lang.Integer,java.util.SortedMap<java.lang.String,java.lang.String>> instanceNominalWords
java.util.SortedMap<java.lang.String,java.util.SortedSet<java.lang.String>> nominalWordValueMap
java.util.Map<java.lang.Integer,java.lang.Integer> docLengthMap
java.util.Map<java.lang.String,java.lang.Integer> idfMap
public java.util.Map<java.lang.Integer,java.lang.String> getDocumentClasses()
public void setDocumentClasses(java.util.Map<java.lang.Integer,java.lang.String> documentClasses)
public java.util.SortedSet<java.lang.String> getClasses()
public void setClasses(java.util.SortedSet<java.lang.String> classes)
public java.util.SortedSet<java.lang.String> getNumericWords()
public void setNumericWords(java.util.SortedSet<java.lang.String> numericWords)
public java.util.Map<java.lang.Integer,java.util.SortedMap<java.lang.String,java.lang.Double>> getInstanceNumericWords()
public void setInstanceNumericWords(java.util.Map<java.lang.Integer,java.util.SortedMap<java.lang.String,java.lang.Double>> instanceNumericWords)
public java.util.Map<java.lang.Integer,java.util.SortedMap<java.lang.String,java.lang.String>> getInstanceNominalWords()
public void setInstanceNominalWords(java.util.Map<java.lang.Integer,java.util.SortedMap<java.lang.String,java.lang.String>> instanceNominalWords)
public java.util.SortedMap<java.lang.String,java.util.SortedSet<java.lang.String>> getNominalWordValueMap()
public void setNominalWordValueMap(java.util.SortedMap<java.lang.String,java.util.SortedSet<java.lang.String>> nominalWordValueMap)
public java.util.Map<java.lang.Integer,java.lang.Integer> getDocLengthMap()
public void setDocLengthMap(java.util.Map<java.lang.Integer,java.lang.Integer> docLengthMap)
public java.util.Map<java.lang.String,java.lang.Integer> getIdfMap()
public void setIdfMap(java.util.Map<java.lang.String,java.lang.Integer> idfMap)
public boolean isTfIdf()
public void setTfIdf(boolean tfIdf)